从云原生走向 AI 原生:一套面向未来的架构方法论 → 阅读《AI 原生基础设施》

运层:系统演化的阶段与循环

运(Yùn) 在此指系统所经历的发展阶段和时序节奏,可理解为基础设施的生命周期循环或"运势"。

大型基础设施并非一成不变,而是在探索期平台期规模期再平衡期之间周期性演进,每个阶段都有其主要矛盾和任务。

下面是四个演化阶段。

探索期(初生阶段)

特点:高方差、低结构、快速试错

此阶段新技术和需求层出不穷,系统架构松散,多样化实验并存。

主要任务

  • 探索有效路径
  • 快速验证模型和功能方向
  • 收集数据和初步的稳定性信号

五行特征木火当令

  • 模型创新(木)和算力尝试(火)是核心驱动力
  • 扩张(阳)多于约束(阴)

架构策略

  • ✓ 容忍一定混沌
  • ✓ 鼓励创新迭代
  • ✓ 关注收集数据和初步的稳定性信号
  • ✗ 不要过早引入繁重的流程和限制

平台期(成长阶段)

特点:标准化出现、接口与流程收敛

经过探索后,系统进入整合与规范阶段,开始建立统一的平台、标准接口和治理流程,将分散成果沉淀为平台能力。

主要任务

  • 建立统一的平台
  • 制定标准接口
  • 沉淀治理流程

五行特征火生土

  • 算力与功能的成功实践(火)催生出平台化支撑需求(土)
  • 治理和规范逐步加强

架构策略

  • ✓ 提炼共性需求
  • ✓ 搭建支撑平台(阴增)
  • ✓ 为下一步规模化打基础
  • ✗ 不要停留在无序探索

规模期(成熟阶段)

特点:效率、吞吐、成本成为主战场

系统已大规模应用,关注点转向优化效率和成本,提升吞吐量和可靠性。

主要任务

  • 优化效率
  • 提升吞吐量
  • 降低成本
  • 保障可靠性

五行特征土重木折

  • 平台(土)和硬性约束开始占主导
  • 过于理想化的模型扩张(木)将遭遇现实条件的折损

架构策略

  • ✓ 强化监控与自动化运维
  • ✓ 通过治理手段控制"阳"过强的部分
  • ✓ 确保系统稳健运行
  • ✗ 不要还沿用创业期的随意做法

再平衡/替代期(更新阶段)

特点:旧结构被修正,或被新结构替代

当上一阶段的模式走到极限,系统要么进入自我纠偏、引入新要素重新平衡,要么被新范式颠覆替代。

主要任务

  • 引入新要素重新平衡
  • 或接受新范式替代

五行特征金水复起

  • 被压制的硬件/规则创新(金)和数据新潜能(水)重新兴起
  • 推动体系变革

架构策略

  • ✓ 有前瞻性,敢于破局
  • ✓ 平稳过渡,避免剧烈震荡
  • ✗ 不要恋栈不前

演化循环

上述阶段呈循环往复之势,每个阶段的终点也是下一阶段的起点

图 1: AI 基础设施演化的“运”循环。系统从探索期起步,经过平台期规范化,进入规模期优化效率,最终走向再平衡或替代的新周期。
图 1: AI 基础设施演化的“运”循环。系统从探索期起步,经过平台期规范化,进入规模期优化效率,最终走向再平衡或替代的新周期。

顺势而为的艺术

一个成熟的基础设施组织应能根据内外信号判断所处阶段,顺势而为地调整战略。

若阶段转换被忽视或被过度催促,系统就会产生扰动甚至危机

错误示例

错误行为表现后果
揠苗助长将尚处探索期的系统当作规模化系统管理,过早压制变化扼杀创新
逆运而行该进入平台期时仍停留在无序探索错失结构化成长的窗口并埋下隐患
恋栈不前应该进入再平衡期却不愿变革系统僵化老化
表 1: 发展阶段特征

阶段判断清单

通过"运"层视角,团队可以审视当前所处的宏观阶段:

  • 我们是在验证新概念,还是在扩大战果?
  • 系统的主要矛盾是什么?
  • 下一阶段可能何时到来?
  • 我们的策略是否符合当前阶段?

示例问题

  • 我们是在探索期吗?
    • 如果是 → 重点关注快速试错和验证
    • 如果不是 → 考虑是否需要进入平台期
  • 我们的系统是否需要标准化?
    • 如果是 → 进入平台期,建立平台和标准
    • 如果否 → 继续探索
创建于 2026/02/10 更新于 2026/02/10 1305 字 阅读约 3 分钟

提交勘误/建议