Ark 的最大价值在于工程范式的重塑,而非功能本身。它为 AI Infra 指明了方向,也为社区生态留下了巨大空间。
最近我们 ArkSphere 社区 里有不少人开始研究 McKinsey 开源的 Ark(Agentic Runtime for Kubernetes) 。
有人觉得它很激进,有人觉得它是咨询公司玩票,也有人抛出那句现实主义金句:
现阶段需要的是“agentic runtime 圈子的现实主义”,而不是“统一模型的浪漫主义”。
这句话我非常认同。
我花了点时间分析 Ark 的源码、架构和设计理念,也结合我们社区的讨论,最终得出的判断是:
Ark 的意义不在功能,而在范式。
它不是答案,但它指向了 AI Infra 的方向。
下面是我对 Ark 的解读,偏工程、偏架构、偏趋势,也包括对 ArkSphere 的启发。
Ark 到底是什么?
Ark 的核心定位是:把 Agent 当成 Kubernetes Workload 来运行的 Runtime。
它不是框架、不是 SDK、不是 AutoGen 那类多智能体工具,而是一个完整的系统,包括:
- 控制面(Controller)
- 自定义资源模型(CRD, Custom Resource Definition)
- API 服务
- Dashboard
- CLI
- Python SDK
本质上,Ark 是 Agent 的控制平面(Control Plane)。
Ark 在 Kubernetes 中定义了七类核心 CRD。下方流程图展示了这些资源之间的关系:
通过这套 CRD,Ark 将 Agent 系统资源化、声明式化,从而具备了如下能力:
- 生命周期管理
- 多租户隔离
- RBAC(Role-Based Access Control,基于角色的访问控制)
- 可观测性
- 可升级性
- 可扩展性(工具、模型、MCP)
换句话说,Ark 关注的不是“怎么写 Agent”,而是“怎么在企业级系统里运营 Agent”。
三层架构:语言与组件混搭,但体系完整
Ark 的整体架构分为三层,分别对应不同的技术栈和职责。下方流程图展示了各层组件的关系:
这不是“贴膜项目”,而是一个完整可运行的 AI Runtime 体系,工程化程度远高于目前市场上的 Agent 框架。
它是不是 AI 时代的 Kubernetes?
回顾 Kubernetes 的核心价值:
Kubernetes 从来不是“统一云 API”,它统一的是“应用运行模型”。
云厂商 API 没统一,网络没统一,存储没统一。统一的是:Pod、Deployment、Service 这些应用模型。
Kubernetes 的成功在于:
它在差异之上提供了一个稳定的应用抽象。
Ark 的目标并不是统一所有大语言模型(LLM)、MCP 或工具格式,而是:
Agent 的资源模型(CRD) + 控制面(Reconciler) + 生命周期。
从这个角度看,Ark 提供了 AI 时代的“声明式应用模型”雏形。
能否成为“AI 时代的 Kubernetes”,目前还言之过早,但它已经提供了一个种子。
和其他框架对比:不在一个层级
当前主流 Agent 框架如 LangChain、CrewAI、AutoGen、MetaGPT 等,解决的问题与 Ark 完全不同。
下表对比了各框架的定位与局限:
| 名称 | 解决什么问题 | 本质局限 |
|---|---|---|
| LangChain | Agent/Tool 组合 | 不关心部署与治理 |
| AutoGen | 多 Agent 对话 | 缺乏控制面和生命周期 |
| CrewAI | 工作流式多 Agent | 缺少调度、RBAC、资源模型 |
| MetaGPT | Agent SOP | 只是执行逻辑,不是平台 |
| OpenDevin | AI IDE/开发助手 | 不是 Agent Runtime |
| Ark | Agent 的控制平面 + 资源化体系 | 功能尚未成熟 |
简而言之:
- 其他工具关注“怎么写 Agent”。
- Ark 关注“Agent 怎么运行、调度、治理、观测、扩展”。
这就是架构级别的差异。
执行流程:像 Pod 一样被调度的 Agent
Ark 的执行流程非常接近 Kubernetes 控制器模型。下方时序图展示了核心流程:
可以看到,Ark 的流程逻辑透明,工程路径清晰,让 Agent 系统进入“可控”状态。
生产可用性:方向正确,但仍是技术预览
根据官方标注和源码成熟度,目前 Ark 具备如下特性:
- 可运行
- 可学习
- 可扩展
- 但暂不建议在生产环境大规模使用
主要原因包括:
- CRD 结构可能变动
- API 尚不稳定
- MCP 生态尚未成型
- Memory 服务仍较为简单
- 多 Agent Team 执行策略较初级
但工程体系已经成型,这一点非常重要。
社区活跃度:小而精,麦肯锡强驱动
从 GitHub 数据来看:
- Stars:222
- Fork:50
- Contributors:48
- Commit 频率持续
- 绝大多数贡献来自麦肯锡内部
注:数据截止到本文发稿时 2025 年 12 月 2 日。
稳定度高,但开放性一般。
这也是 ArkSphere 的机会所在:
范式是对的,但生态需要社区来推动。
2026 的趋势:从框架时代走向 Runtime 时代
经过深度分析,我越来越确定如下判断:
- 2023–2024:大模型 API 调用时代
- 2024–2025:Agent 框架时代
- 2025–2027:Agent Runtime / Control Plane 时代(Ark 的方向)
当所有人都在写 Agent 的 Python 脚本时,真正的价值在于:
- 多 Agent 任务调度
- 工具注册与治理
- Session/Memory 生命周期
- 结果可复现性
- RBAC、审计、租户隔离
- 可观测性
- 企业内部个人化智能体系统
Ark 正在提供一个可落地的路径。
对 ArkSphere 的启发
Ark 给 ArkSphere 的启发非常关键且直接:
ArkSphere 不应该做“功能堆叠”,而应该做“范式建设”
Ark 提供了未来 Agentic Runtime 的雏形:
- 资源模型
- 控制面
- 工具注册
- 多 Agent 协作
- 评估与治理
ArkSphere 的角色应该是:
汇聚范式、产出规范、孵化生态,而不是重写 Ark 本身。
这就是“AI 原生时代的 CNCF(Cloud Native Computing Foundation)”。
中国本土化空间巨大
本土化可做的方向包括但不限于:
- 国产大语言模型对接(如 Qwen、DeepSeek、智谱)
- 企业私有化场景
- 本地工具/MCP Discovery 生态
- 多集群/边缘推理
- 企业级 RBAC、审计、数据隔离
- 更适合工业场景的 AgentSpec
- Runtime/Controller 的增强版本
换句话说:
Ark 解决的是“模型”,而 ArkSphere 可以解决的是“生态”。
我们要的不是“LLM 时代的 Kubernetes”,而是“AI Runtime 的产业级认知体系”
拆解 Ark 后最大的感受是:
AI 原生的未来不是一堆工具,而是一套工程体系。
ArkSphere 可以成为这套体系的发起者。
总结
Ark 并非“万能 Runtime”,也不是“AI 时代的 Kubernetes 终极版本”。
但它做对了一件关键的事情:
它把过去大家在写 Python Agent 脚本时绕不开的痛点,全部抽象成了 Kubernetes 下的资源和控制器。
它代表的是工程学,而不是 Demo。
它不够成熟,但方向是对的。
它不是终点,但它给了我们一条清晰的路线图。
对于我正在运营的 ArkSphere 社区来说,Ark 给了一个明确启发:
未来属于 Runtime,属于 Control Plane,属于可治理的 Agent 系统。
而真正能把这套体系做大的,不是麦肯锡,而是社区。