在过去一年里,我发现云原生产业迎来了一个显著趋势:大量原先专注于云原生的企业开始拥抱生成式 AI,甚至把自己的产品线重新定位为"AI 原生"或"智能代理平台"。这种转型不仅体现在功能层面的升级,还涉及业务模型、用户定位和市场战略的调整。
引子
2025 年 9 月,一则新闻引起了我的注意:Rancher 创始人梁盛 (Sheng Liang) 宣布其新公司 Acorn Labs 将从 Kubernetes 管理工具全面转向 AI 代理平台(见 Why Rancher’s Founders Pivoted From Kubernetes to Agentic AI )。梁盛是我相识 7 年的朋友,他是一位连续创业者,之前创立的 Cloud.com 被 Citrix 收购,后来又创立了在云原生时代名声大噪的 Rancher,最终被 SUSE 收购。这是他第三次创业,这次他选择离开已经成熟但竞争激烈的 Kubernetes 市场,转而押注于 AI 代理这个全新领域。
梁盛在接受采访时表示:“我们看到 AI 代理将成为软件开发的主要方式,就像云原生曾经改变基础设施一样,AI 代理将重新定义软件构建和交付的方式。“他认为,虽然 Kubernetes 市场规模庞大,但已经被大厂主导,创业公司的机会窗口已经关闭。相比之下,AI 代理领域仍处于早期阶段,需要全新的基础设施、工具和最佳实践。Acorn Labs 的新平台旨在让开发者无需深入的机器学习知识,就能轻松创建、部署和管理 AI 代理。
这个转型决策让我陷入了思考。梁盛作为云原生领域的先行者,他的战略转向不是一时兴起,而是基于对技术趋势的深刻洞察。如果连 Rancher 这样的云原生领军企业都在转向 AI 原生,这是否意味着整个行业正在经历一次范式转移?本文将以此为引子,结合 Gitpod 改名为 Ona(见 Gitpod is now Ona, moving beyond the IDE )、流量管理、基础设施管理、代码构建和 DevOps 等不同领域的代表性公司,对 AI 大潮下传统 SaaS/云原生/基础设施/开发者工具公司的转型路径和趋势进行深度分析。
AI 浪潮对云原生领域的影响
大语言模型(LLM)和生成式 AI 的爆发式增长导致企业对 AI 接入与治理的需求激增。以 API 网关领域为例(见我之前写的博客 深入解析 AI Gateway:新一代智能流量控制中枢 ),传统 API 网关在 AI 场景下遇到多方面挑战:一是 LLM 调用计费依据令牌数而非请求次数,需要对每个请求的 token 使用量进行精细管理;二是 LLM 输出存在不可预测性,网关不仅要检查输入还要过滤返回内容;三是 AI 应用常常需要同时使用多个模型或多个供应商,传统网关缺乏根据请求内容动态路由到最合适模型的能力;四是需要在高并发、流式返回的场景下进行实时性能与成本优化。文章还指出,自 2023 年下半年起,Envoy、Apache APISIX、Kong、Solo.io、Tetrate、F5 等社区或厂商纷纷发布 AI Gateway 项目或产品,用插件或模块的方式将 AI 流量管理和安全治理纳入网关能力范畴。
这一波 AI 浪潮带来的核心变化可归纳为:
- 工作负荷更加"AI 化”:开发者开始要求平台提供自然语言生成代码、自动部署和环境配置等功能。
- 成本与风险新维度:生成式模型按令牌计费且响应不可预测,促使企业建立新的治理手段和成本控制策略。
- 多模型与混合云架构:为了避免供应商锁定,企业倾向同时使用多个模型并在公有云和本地部署混合使用,这对流量管理与安全合规提出了更高要求。
- 从工具到代理:很多厂商将生成式 AI 功能升级为"智能代理”,能够理解上下文并代替人完成任务,意味着产品形态从辅助工具转向半自主系统。
案例研究:云原生企业的 AI 转型
下面我们选择几个不同领域的代表性企业进行深入分析。
Gitpod → Ona:从浏览器 IDE 到 AI 软件工程代理
Gitpod 曾是颇受欢迎的在线开发环境平台,它提供了浏览器中的 VS Code 和预配置的开发容器。然而,随着生成式 AI 的崛起,公司在 2025 年 9 月宣布重塑品牌并更名为 Ona。新官网解释了这一转型:公司认为"IDE 定义了上一代,智能代理将定义下一代",工程师需要的不是一个简单的 IDE,而是能让 AI 代理陪伴整个软件生命周期的"任务控制中心"。新平台重新定位为"为个人团队提供软件工程代理的使命控制台",允许用户在 Ona 上探索、分解、委派、编码、评审和编写文档,它由三大组件组成:
- Ona Environments:沙箱化的云开发环境,使用
devcontainer.json
和automations.yml
进行声明式定义,可在 Ona 云或私有 VPC 中运行。 - Ona Agents:具备私有模型访问和 MCP(Model Context Protocol)支持的工程代理,用户可通过对话界面或 VS Code 浏览器版与代理协作,使用斜杠命令共享工程师最佳实践。
- Ona Guardrails:提供企业级的安全合规与控制,支持 RBAC、OIDC、命令拒绝列表、审计日志,以及在企业 VPC 内部署。
Ona 还公布了内部使用效果:他们的 Ona Agents 在一周内共同撰写了公司 60% 的合并 PR,并贡献了 72% 的代码。这些变化表明 Gitpod 正在从在线 IDE 供应商转型为具有自动化编程代理、流程管理和安全控制的 AI 原生开发平台。
Tetrate:利用服务网格经验跨足 AI 流量管理
Tetrate 作为笔者曾工作多年的公司,以维护和商业化 Envoy/Istio 服务网格而闻名。随着如今众多企业将多个 LLM 集成到业务中,Tetrate 在 2025 年推出了 Agent Router Service (TARS),用于动态路由 AI 请求并优化模型成本。官方博客指出,该服务在 Goose 集成中提供一键配置,用户无需维护多个模型供应商的 API 密钥即可访问 GPT‑5、Claude Opus 4.1、Grok 4 以及开源模型等前沿模型。它还提供 $10 免费额度,并在后台根据任务复杂度自动在模型间切换,支持统一认证、自动故障转移和成本优化。更重要的是,Tetrate 将在服务网格中积累的 智能路由、负载均衡和弹性机制 应用于 AI 场景,使 AI 调用能够根据令牌价格和响应时间等因素进行动态路由。
公司在新闻稿中表示,TARS 能根据推理成本、查询复杂度、模型性能或任务特异性将 AI 查询动态路由到最合适的模型。它支持多租户或本地部署,并允许开发者使用自己的 API 密钥或 Tetrate 提供的密钥接入模型。内置功能包括自动回退到更可靠或更便宜的模型、交互式提示调试和 A/B 测试。对于聊天机器人,它会将会话路由到响应更快或更具成本效益的模型;对于代码生成,它能根据编程语言、上下文和合规要求动态选择模型;对于自主代理,它协调多个 LLM 调用并控制成本。Tetrate 还将其 AI 网关与 Agent Operations Director 结合,通过 NIST 和 FINOS 标准加强模型治理和合规性。
此外,Tetrate 正在通过 AI 网关保持竞争力,其主导的开源项目 Envoy AI Gateway 为组织提供统一的 API,以管理来自多个模型的请求。新推出的路由服务让开发者可以用 Tetrate 提供的或自有的 API 密钥访问不同模型,并通过提示调试、自动回退及 A/B 测试避免供应商锁定。业内分析师认为,随着开发者同时使用多个 LLM,AI 流量路由器已成为不可或缺的基础设施,它们帮助在性能和成本之间取得平衡。
Replit Agent:从 IDE 到"生成应用"平台
在线开发平台 Replit 在 2024 年 9 月发布了 Replit Agent,定位为能够从自然语言直接创建和部署应用的 AI 系统。借助 Replit Agent,用户只需几句话和几分钟,就可以将一个想法变成部署好的应用。Replit Agent 像一名对等程序员,它会自动配置开发环境、安装依赖并执行代码。官网介绍强调,这种方式"无需代码",用户告诉 Agent 自己想做什么,它会自动生成应用和网站,甚至可以上传一张参考截图让 Agent 完成相似页面。该平台强调 Agent 能够迅速从想法生成原型,并拥有修复 bug 的能力,集成所有构建工具于一处。
Replit 的转型说明,在线编程平台正在向"应用生成器"演变:用户的交互方式从编写代码转为描述需求,平台则通过大模型与执行环境的结合快速交付结果。这种模式降低了软件开发门槛,同时也模糊了开发者与非开发者的界限。
GitLab Duo:AI 原生 DevSecOps 平台
GitLab 在 2024 年推出了 GitLab Duo,致力于在整个软件生命周期中引入生成式 AI。GitLab Duo 声称是唯一覆盖"从规划和编码到安全与部署"的 AI 解决方案。它强调隐私优先,企业可以控制哪些用户和项目使用 AI 功能,并保证私有代码不会用于训练模型。该平台通过单一界面集成最适合各个环节的模型,提供智能代码建议、自动化安全修复、实时问答和生成测试等功能。
2025 年 9 月发布的 GitLab 18.4 版本进一步提出了"AI 原生开发“愿景,包括以下亮点:
- AI Catalog 与自定义代理:用户可以在 AI Catalog 中创建、共享和协作自定义代理,例如为产品规划、文档编写或安全合规构建专属代理,让代理像团队成员一样执行特定任务。
- Agentic Chat:让开发者与代理自然对话。新版支持对话会话管理、在会话中选择不同模型,以及改进的工具调用审批,使协作更流畅。
- Knowledge Graph:为代理和人提供项目的知识图谱,将代码文件、路由和引用关联起来,使开发者可以在聊天中查询"项目中有哪些路由文件"或"某次修改影响了哪些模块"等问题。
- Fix Failed Pipelines Flow:利用 AI 实现业务感知的流水线修复。该流程不仅分析失败日志,还结合业务优先级和跨项目依赖生成修复方案,并自动创建包含业务背景的 merge request。
- 模型选择与治理:18.4 版本提供模型选择功能,允许用户在不同 LLM 之间切换,并在自管理环境中支持 GPT -5 或开源模型,满足合规需求。
GitLab 的转型展示了 DevSecOps 平台如何将生成式 AI 深度嵌入现有流程:通过代理化的协作方式自动完成规划、编码、测试和运维任务,同时强调隐私和模型治理。
Pulumi Copilot:面向基础设施的对话式 AI
基础设施即代码(IaC)平台 Pulumi 在 2024 年推出了 Pulumi Copilot。官方文档将其描述为"集成到 Pulumi Cloud 的对话式聊天界面,结合生成式 AI 与 Pulumi Cloud 的强大能力,使用户能够更快速完成云基础设施管理任务”。Copilot 的核心能力包括:
- 访问和探索云资源:用户可以查询任何由 Pulumi 管理的资源状态,并通过 Pulumi Insights 的 Supergraph 支持访问 160 多家云供应商的数据,了解项目、堆栈、更新、部署、审计日志等历史信息。
- 基础设施编写与部署:Pulumi AI 以聊天方式帮助用户编写 IaC 代码并直接在 Copilot 中部署。
- 访问实时云元数据:通过新增的"技能",Copilot 可实时获取 AWS、Azure、Kubernetes 等平台的元数据,结合 Pulumi 世界观分析资源使用、成本和尚未纳入管理的基础设施。
- 系统提示与自定义:管理员可通过系统提示对 Copilot 的默认行为进行自定义,适配团队需求与策略。
Pulumi Copilot 使用 OpenAI 的 GPT‑4o 模型,它继承 Pulumi Cloud 的 RBAC 权限模型,目前仅能执行只读操作,未来将扩展到可执行操作并提供可控的读写权限。这一转型展示了 IaC 工具厂商如何利用 AI 降低基础设施运维门槛,并通过对话式体验提供成本分析和快速部署功能。
Datadog Bits AI:自动化运维与安全分析
可观测性平台 Datadog 在 2025 年推出了 Bits AI 套件,包括 Bits AI SRE、Bits AI Security Analyst 和 Bits AI Dev Agent。来自技术博客的梳理显示,Bits AI SRE 通过生成多个假设并验证各类监控数据,为根因分析提供自动化支持。它像一名 24/7 的自治队友,实时分析日志、指标、追踪以及 Watchdog 警报,并将假设分类为已验证、已否定或需要进一步调查,从而大幅缩短人工排查时间。实际案例中,Bits 已帮助全球运营团队在高峰期加速故障排查。
Bits AI Security Analyst 通过 MITRE ATT&CK 框架自动规划和执行安全调查,主动处理 Datadog Cloud SIEM 的信号,并提供可操作的建议。Bits AI Dev Agent 则聚焦代码修复,它会监控遥测数据、识别关键问题并生成生产级的修复 PR,让工程师直接在代码仓库中审查和合并。这些代理共享模型上下文并可共同分析异常或扩容基础设施。平台声称,该套件可将安全调查时间从 30 分钟缩短至 30 秒,并为公司节省数千小时工程时间。Bits AI 的推出标志着可观测性供应商正从被动监控转向主动诊断和自动修复,构建 AI 原生运维体系。
趋势分析:不同领域企业的转型路径与启示
综合上述案例,可以发现传统云原生公司转向 AI 原生存在一些共性策略和差异化路径:
- 核心产品重塑与品牌升级:Gitpod 直接更名为 Ona,并将产品定位从在线 IDE 升级为"软件工程代理中心",体现了彻底的战略转型。其他如 GitLab、Pulumi 则在原有品牌下推出新平台,但都突出"AI 原生"概念。
- 借助现有技术优势拓展新场景:Tetrate 利用其在服务网格和 Envoy 领域的技术积累,把智能路由、负载均衡等能力迁移到 AI 流量管理,实现平滑转型。
- 构建"智能代理"平台化生态:GitLab 的 AI Catalog、Agentic Chat 与自定义代理,让企业可以像管理团队成员一样管理 AI 代理。Ona 和 Replit 也都强调代理(agent)概念,用户与代理协作完成开发任务。这意味着厂商正在从提供单一 AI 功能转向提供可组合、可扩展的代理生态系统。
- 重视安全、合规与成本治理:在企业场景中,生成式 AI 的使用需要细粒度权限控制、审计和合规。Tetrate 的路由服务支持隔离部署并与合规框架对齐;GitLab 提供 AI 透明中心和模型选择机制;Pulumi 与 Datadog 都强调数据安全和权限模型。另外,Tetrate 路由服务和 AI Gateway 通过按令牌计费与自动降级模式帮助控制成本。
- 多模型与开放生态:为了避免垄断和不确定性,多个平台支持用户自行选择模型或使用开源模型。Tetrate 支持 GPT‑5、Claude、Grok 等多种模型;GitLab 允许自定义模型选择并计划在自托管版支持 GPT‑5 和开源模型;Pulumi 允许管理员自定义系统提示和模型行为。这些趋势预示着未来的 AI 平台会越来越强调多模型互操作性。
- 从自动化协助到自主决策:Replit Agent 可以完成应用搭建和部署;GitLab Duo 能生成代码和修复 CI 流水线;Pulumi Copilot 帮助编写与部署基础设施;Datadog Bits AI 能直接生成修复 PR 并自动实施。这些功能说明企业正在尝试让 AI 从"助手"升级为具备决策能力的"执行者"。
与此同时,也要看到转型的挑战:
- 技术复杂度和模型可靠性:LLM 仍存在幻觉和安全风险,如何在自动化与人工审核之间取得平衡是重要课题。Tetrate、GitLab 等均在产品中加入了"手动/辅助模式"和审计机制,以防止代理过度自动化导致失控。
- 市场教育与产品成熟度:AI Gateway 等概念仍然新颖,有些厂商可能只是"换壳"宣传,实际功能并不成熟。企业需要结合自身场景评估 AI 方案的真正价值。
- 成本与商业模式:AI 服务成本高昂且计费模型复杂,平台需要提供灵活的成本管理功能(如 Tetrate 的 cost governance 和 GitLab 的 ROI 度量),同时也要探索新的定价策略。
结论与未来展望
过去一年里,云原生生态中的多家公司通过重塑产品、引入智能代理和 AI 流量管理,积极拥抱生成式 AI。无论是将传统 IDE 转型为 AI 开发控制台的 Ona,利用服务网格经验打造 AI 流量路由器的 Tetrate,还是在 DevSecOps、IaC 和可观测性领域推出代理化功能的 GitLab、Pulumi 和 Datadog,这些实践都表明 AI 原生 正成为下一轮技术浪潮。
未来我们可能看到:
- 平台化的代理生态:企业不再仅仅购买单个 AI 功能,而是选择能够托管、训练和编排多种智能代理的平台;这些代理将覆盖规划、开发、测试、运维和安全的各个环节,并能够互相协作。
- 开放标准和互操作性:Kubernetes Gateway API、Model Context Protocol 等标准有望促进跨平台互联,使代理可以在不同工具间共享上下文和模型能力。开源社区将在这一过程中扮演重要角色。
- 更严格的治理与监管:随着 AI 能力的增强,权限、合规和成本控制将成为平台竞争力的一部分。企业需要在使用 AI 提升效率的同时,确保数据安全和伦理规范。
- 从工具到伙伴:生成式 AI 不只是自动化工具,它将成为团队的重要伙伴。开发者与代理的互动方式更像协作而非指令,这要求平台在交互体验和人机协同方面持续创新。
总之,AI 原生时代带来了软件工程范式的深刻变化。对于云原生领域的企业而言,抓住这一波浪潮意味着机会与挑战并存:既要充分释放 AI 带来的效率提升和创新空间,又要在安全、可靠和合规的前提下构建稳健的产品和生态。我们正处于这一转型的起点,未来值得期待。
参考资料
- Gitpod is now Ona, moving beyond the IDE - ona.com
- Gitpod rebrands as Ona, now an AI-driven dev platform - theregister.com
- Tetrate: Safe, Fast, and Profitable AI for the Enterprise - tetrate.io
- Simplify Local AI Agents with Goose and Tetrate Agent Router Service - tetrate.io
- Tetrate Launches Agent Router Service to Streamline GenAI Cost Control - tetrate.io
- Tetrate steps up to handle traffic management for AI agents - siliconangle.com
- In-Depth Analysis of AI Gateway: The New Generation of Intelligent Traffic Control Hub - jimmysong.io
- Replit AI – Turn natural language into apps and websites - replit.com
- Introducing Replit Agent - blog.replit.com
- GitLab Duo - about.gitlab.com
- GitLab 18.4: AI-native development with automation and insight - about.gitlab.com
- Pulumi Copilot | Pulumi Docs - pulumi.com
- AI-First Observability: How DASH 2025 Redefined Autonomous Operations - medium.com