Skip to content

KubeNova 项目介绍

什么是 KubeNova?

KubeNova 是一个企业级 Kubernetes 多集群管理平台,专为需要统一管理多个 Kubernetes 集群的企业和团队设计。平台以项目为核心视角,通过"项目 → 集群配额 → 工作空间"三级架构,实现了多租户资源隔离与统一管理,让复杂的 Kubernetes 运维变得简单高效。

@YanShicheng

愿景

无论是管理少量微服务,还是跨多集群编排数千容器,KubeNova 都能提供所需的可扩展性、可靠性和可观测性。

2026-01-15 @YanShicheng

代码仓库

仓库GitHubGitee
后端代码yanshicheng/kube-novaikubeops/kube-nova
前端代码yanshicheng/kube-nova-webikubeops/kube-nova-web
operatoryanshicheng/kube-nova-operatorikubeops/kube-nova-operator

Docker 镜像

服务模块Docker Hub阿里云镜像
portal-apiikubeops/portal-api:latestregistry.cn-hangzhou.aliyuncs.com/kube-nova/portal-api:latest
portal-rpcikubeops/portal-rpc:latestregistry.cn-hangzhou.aliyuncs.com/kube-nova/portal-rpc:latest
console-apiikubeops/console-api:latestregistry.cn-hangzhou.aliyuncs.com/kube-nova/console-api:latest
console-rpcikubeops/console-rpc:latestregistry.cn-hangzhou.aliyuncs.com/kube-nova/console-rpc:latest
manager-apiikubeops/manager-api:latestregistry.cn-hangzhou.aliyuncs.com/kube-nova/manager-api:latest
manager-rpcikubeops/manager-rpc:latestregistry.cn-hangzhou.aliyuncs.com/kube-nova/manager-rpc:latest
workload-apiikubeops/workload-api:latestregistry.cn-hangzhou.aliyuncs.com/kube-nova/workload-api:latest
kube-nova-webikubeops/kube-nova-web:latestregistry.cn-hangzhou.aliyuncs.com/kube-nova/kube-nova-web:latest
kube-nova-operatorikubeops/kube-nova-operator:latestregistry.cn-hangzhou.aliyuncs.com/kube-nova/kube-nova-operator:latest

架构图

项目架构图.png

为什么选择 KubeNova?

降低 Kubernetes 使用门槛

Kubernetes 功能强大但复杂度高,对于开发和运维团队来说学习曲线陡峭。KubeNova 提供了直观的 Web 界面和简化的 API,让团队能够专注于业务开发,而非底层基础设施的复杂性。

同时平台也可以提高工作效率,pod 日志,交互式终端等可以有效帮助运维同学进行便捷的管理工作。

统一多集群管理

企业通常需要管理多个 Kubernetes 集群(开发、测试、生产环境,或跨区域部署)。KubeNova 提供单一控制平面,让您可以从一个界面管理所有集群,告别在多个 kubectl 上下文之间切换的烦恼。

企业级多租户支持

通过三级资源隔离架构和完整的 RBAC 权限体系,KubeNova 支持企业内部多个团队共享基础设施,同时确保资源隔离和安全访问控制。

生产就绪的运维能力

KubeNova 不仅仅是一个管理界面,它提供了完整的生产运维能力,包括五维监控、智能告警、灰度发布、审计日志等企业级特性。

核心理念

KubeNova 的设计遵循以下核心理念:

以项目为中心:打破传统以集群为中心的管理模式,让业务项目成为资源组织的核心单元,更贴合企业实际的组织结构和工作流程。

以应用为中心的管理:拒绝频繁切换页面,deployment,sts,daemonset,cronjob 统一管理,svc,ingress 一站式管理。

简化而非简陋:在屏蔽 Kubernetes 底层复杂性的同时,保留对容器化工作负载的精细化控制能力。平台所有资源均支持 YAML 导入,表单与 YAML 无缝转换,满足不同用户的操作习惯。

云原生优先:原生支持 Kubernetes 部署,与 Prometheus、Alertmanager、Istio 等云原生生态无缝集成。


功能特性

一、多租户与资源管理

三级资源隔离架构

KubeNova 采用"项目 → 集群配额 → 工作空间"的三级架构,为提供灵活的资源隔离方案:

项目(Project) 是最高级别的资源隔离单元,对应企业的业务线、产品或团队。每个项目可以分配专属的管理员和成员,拥有独立的资源配额和计费统计。

集群配额(Cluster Quota) 定义了项目在特定集群中可使用的资源上限,包括 CPU、内存、GPU 等计算资源,以及 Pod 数量、Service 数量等对象配额。支持资源超分配置,在保证资源安全的前提下提高集群利用率。

工作空间(Workspace) 是项目内的逻辑隔离单元,对应 Kubernetes 的 Namespace。每个工作空间可以进一步细分资源配额,并支持 LimitRange 配置,实现 Pod 和 Container 级别的资源限制。

资源超分(Overcommit)

支持 CPU、内存、GPU 的超分配置,允许为项目分配超过集群物理容量的资源配额。通过合理的超分比例配置,可以显著提高集群资源利用率,降低基础设施成本。平台提供超分收益分析功能,直观展示超分带来的资源节约和投资回报。

完整的 RBAC 权限体系

基于角色的访问控制(RBAC),实现用户、角色、权限三层架构。支持菜单权限与 API 权限的独立管控,角色可绑定多种权限组合。用户可关联多个角色,权限自动聚合。前端菜单根据角色权限动态渲染,后端接口实现请求级别的权限校验。

二、多集群管理

集群接入

支持多种集群接入方式,适应不同的安全策略和运维场景:

  • Kubeconfig:直接使用 kubeconfig 文件接入,适合自建集群
  • Token:使用 ServiceAccount Token 接入,适合受限环境
  • 证书认证:使用客户端证书接入,适合高安全要求场景
  • InCluster: 集群内部通过 sa 可直接纳管。

集群资源视图

提供集群资源的全局视图,包括节点列表、资源使用率、配额分配情况等。支持节点标签、污点、注解的管理,以及节点封锁、驱逐等运维操作。

网络与存储

自动发现集群的网络配置和命名空间列表。支持 StorageClass、PersistentVolume、PersistentVolumeClaim 的完整生命周期管理。

三、工作负载管理

全类型工作负载支持

覆盖 Kubernetes 所有工作负载类型:

  • Deployment:无状态应用管理,支持滚动更新与版本回滚
  • StatefulSet:有状态应用编排,提供稳定网络标识与持久化存储
  • DaemonSet:节点级守护进程管理,确保集群全覆盖
  • Job / CronJob:批处理任务与定时任务自动化,完整生命周期控制
  • Pod:直接 Pod 操作,支持调试、临时容器注入等高级排障

应用全生命周期管理

提供启停、重启、扩缩容、滚动更新等标准操作。完整的版本历史追踪,支持一键回滚到任意历史版本。镜像批量更新功能,简化多服务同时升级的流程。

应用编排能力

环境变量注入:支持字面量、ConfigMap、Secret、字段引用等多种来源的环境变量注入。

健康检查:完整支持 Liveness、Readiness、Startup 三种探针的配置和管理。

调度策略:提供节点选择器、节点亲和性、Pod 亲和/反亲和、污点容忍、拓扑分布约束等高级调度能力。

存储卷配置:支持 EmptyDir、HostPath、ConfigMap、Secret、PVC、NFS 等多种卷类型的配置和挂载。

四、配置与网络

配置管理

ConfigMap:应用配置管理,支持使用追踪和依赖分析。

Secret:敏感数据安全管理,支持类型过滤和引用追踪。

服务发现与流量管理

Service:支持 ClusterIP、NodePort、LoadBalancer、ExternalName 等服务类型,提供 Endpoint 可视化。

Ingress:HTTP/HTTPS 路由管理,支持 TLS 证书管理和 IngressClass 配置。

五、弹性伸缩

水平 Pod 自动伸缩(HPA)

基于资源的伸缩(CPU、内存),支持自定义指标(Pods、Object、External)。可配置容器级资源指标,提供伸缩行为和稳定窗口的精细化控制。

垂直 Pod 自动伸缩(VPA)

自动资源推荐,根据历史使用情况优化资源配置。支持容器级资源策略,提供 Off、Initial、Recreate、Auto 多种更新模式。可配置资源边界,确保资源调整在安全范围内。

六、灰度发布

Flagger 集成

原生集成 Flagger,提供自动化的渐进式发布能力:

金丝雀发布:渐进式流量切换,自动化指标分析,实时监控新版本健康状况。

A/B 测试:基于 Header 的流量路由,支持特性验证和用户体验对比。

蓝绿部署:零停机发布,支持即时回滚,降低发布风险。

自动回滚:基于指标的故障检测与恢复,发现问题自动回滚到稳定版本。

Webhook 集成:支持自定义验证门禁和通知,与 CI/CD 流水线无缝对接。

七、智能告警

多渠道通知

支持 8 种主流通知渠道,满足不同团队的协作习惯:

  • 钉钉:钉钉机器人 Webhook
  • 企业微信:企业微信机器人
  • 飞书:飞书机器人 Webhook
  • 邮件:SMTP 邮件通知
  • 短信:短信网关集成
  • 语音电话:语音呼叫通知
  • Webhook:自定义 HTTP 回调
  • 站内信:平台内置消息系统

智能路由

告警分级:按严重级别(Info/Warning/Critical)配置不同通知渠道,确保关键告警及时触达。

告警分组:支持自定义告警分组,深度定制分组告警规则。

标签过滤:基于告警标签的智能匹配与路由,实现精准的告警分发。

Alertmanager 集成

与 Prometheus Alertmanager 原生集成,自动解析告警标签,关联集群、项目、工作空间。完整的告警生命周期管理(firing → resolved),发送记录全链路追踪。

WARNING

需要按照平台规则进行接入。

八、监控与可观测性

全方位监控体系

Pod 监控:资源使用率、网络流量、存储 I/O、健康状态全方位监控。

Node 监控:CPU、内存、磁盘、网络、系统指标的实时监控和历史分析。

Namespace 监控:配额使用情况、工作负载状态、资源 Top 排行。

集群监控:控制面(API Server、etcd、Scheduler、Controller Manager)健康状态和性能指标,集群资源容量规划。

Ingress 监控:入口流量、请求性能、错误率、TLS 证书状态监控。

.....

Prometheus 集成

自动配置 Prometheus 连接,支持 Basic Auth、Token、API Key 多种认证方式。PrometheusRule 告警规则管理,Probe 黑盒监控配置。

九、Pod 运维工具

日志管理

实时日志流查看,支持多容器日志聚合。历史日志查询,支持时间范围和关键字过滤。日志下载功能,便于离线分析和归档。

交互式终端

Web 终端直接连接容器,执行命令进行调试和排障。支持多容器选择,临时容器注入。

文件管理

容器文件系统浏览,支持文件和目录的查看。文件编辑、上传、下载功能,支持文件压缩和解压。

十、镜像仓库管理

Harbor 集成

支持多个 Harbor 仓库的统一管理,实现项目级权限隔离。

镜像生命周期

完整的镜像生命周期管理,包括镜像清理策略(GC)、保留策略配置、跨仓库镜像复制。

十一、审计与合规

四级审计日志

完整的操作审计体系,覆盖集群、项目、工作空间、应用四个层级。

多维度查询

支持按时间、操作者、操作类型、资源类型等多维度查询和过滤。所有操作记录支持追溯,满足企业合规要求。

十二、Istio 服务网格(规划中)

流量治理

服务网格可视化管理,提供流量路由、负载均衡、故障注入等能力。

安全策略

mTLS 加密通信,访问控制策略管理。

可观测性

分布式链路追踪,服务拓扑可视化。


技术栈

后端

组件技术选型
开发语言Go 1.25.5+
微服务框架Go-Zero v1.9.4
数据库MySQL 8.0+
缓存Redis 7.0+
认证机制JWT(双令牌机制)
API 协议RESTful HTTP + gRPC

前端

组件技术选型
框架Vue 3.x
UI 框架Art Design Pro

基础设施

组件要求
Kubernetes1.21+
Prometheus可选,用于监控
Alertmanager可选,用于告警
Harbor可选,用于镜像管理
Istio可选,用于服务网格