从云原生走向 AI 原生:一套面向未来的架构方法论 → 阅读《AI 原生基础设施》

五行层:系统角色的分类与协作

五行(Wǔxíng,Five Elements 或 Five Phases)理论将世界万物划分为五种基本元素:木、火、土、金、水。每一元素代表一种基本属性或功能角色,五者相生相克,循环不息。

在 AI 基础设施中,我们用"五行"刻画系统的五类核心要素及其职责:

五行要素的工程映射

五行符号含义工程对应
🌊流动和包容数据流与质量:数据管道、数据资产与质量控制
🌲生长和创造模型生长与能力扩展:模型架构迭代、参数规模扩张
🔥能量和执行算力转化与做功效率:GPU/TPU 计算、作业调度效率
🏔️承载与稳定平台承载与编排治理:分布式协调、中间件、调度系统
⚙️坚固和规范硬件约束与物理边界:GPU/CPU 性能、存储容量、网络带宽
表 1: 五行要素的工程映射

水 (Water) – 数据流与质量

对应系统中的数据管道、数据资产与质量控制

水象征流动和包容,类比数据在系统中的流通润泽作用,包括:

  • 训练数据获取
  • 实时数据输入
  • 反馈信号传输
  • 数据清洗与质量保证

木 (Wood) – 模型生长与能力扩展

对应机器学习模型及算法的演进壮大

木代表生长和创造,映射为:

  • 模型架构的迭代
  • 参数规模扩张
  • 新能力的培养
  • 算法优化与改进

火 (Fire) – 算力转化与做功效率

对应计算过程和算力资源的运用

火象征能量和执行,反映为:

  • 利用 GPU/TPU 等算力进行计算
  • 将电能转化为模型训练推理工作
  • 并行计算能力
  • 作业调度效率

土 (Earth) – 平台承载与编排治理

对应平台层的支撑与治理能力

土代表承载与稳定,类比:

  • 基础设施平台对上层应用的支撑
  • 分布式系统的协调编排
  • 中间件服务
  • 调度系统和策略管理
  • 权限体系、服务质量保障

金 (Metal) – 硬件约束与物理边界

对应底层硬件和系统硬限制

金代表坚固和规范,映射为:

  • GPU/CPU 硬件性能
  • 存储容量
  • 网络带宽
  • 物理条件和硬性规则(功耗、安全规范等)

五行相生关系

五行之间通过"相生"关系形成正向循环

数据(水)催生模型增长(木),模型需求激发算力投入(火),算力发展推动平台厚实(土),平台能力又利用硬件提升边界(金)的极限,硬件进步反过来支持更大的数据获取(水)

图 1: 五行角色相生关系图。水生木、木生火、火生土、土生金、金生水,表示数据、模型、算力、平台、硬件之间相互促进的循环。
图 1: 五行角色相生关系图。水生木、木生火、火生土、土生金、金生水,表示数据、模型、算力、平台、硬件之间相互促进的循环。

五行相克关系

同时,五行之间也存在相克关系,即当某一要素过强或失衡时,会对另一要素形成压制或削弱:

  • 木克土:模型过度扩张会增加平台(土)负担,甚至压垮现有架构
  • 土克水:过重的平台和规则会阻碍数据(水)的自由流动
  • 水克火:数据瓶颈会限制算力发挥
  • 火克金:过度的算力需求可能突破硬件(金)极限
  • 金克木:硬件和规则的严格限制会遏制模型(木)的扩展
图 2: 五行角色相生相克关系图。虚线箭头表示相克关系,体现系统内制衡机制:任一要素过度强盛都会对另一要素形成制约。
图 2: 五行角色相生相克关系图。虚线箭头表示相克关系,体现系统内制衡机制:任一要素过度强盛都会对另一要素形成制约。

图 3:五行角色相生相克关系图。虚线箭头表示相克关系,体现系统内制衡机制:任一要素过度强盛都会对另一要素形成制约。

五行平衡的诊断

通过五行模型,工程团队可以系统性地检查基础设施的角色完整性与平衡

常见失衡模式

失衡模式表现后果解决方案
木强水弱专注模型算法迭代,忽视数据质量模型性能陷入瓶颈加强数据管道和质量控制
金强土弱堆叠硬件,平台治理能力不足资源利用率不佳、缺乏生机完善平台治理和调度
火旺木折算力投入大,模型跟不上资源浪费优化模型架构,提升算力利用效率
表 2: 常见失衡模式

平衡原则

成功的大规模系统需要五种要素的协调配合

  • 让五个要素在各自岗位上各尽其职
  • 保持相生为主,相克为辅
  • 防范任何一方的过度膨胀或萎缩
  • 定期检查五行要素的平衡状态

只有让五个要素在各自岗位上各尽其职、相互生促,同时防范任何一方的过度膨胀或萎缩,整个系统才能保持稳健且具备进化能力

创建于 2026/02/10 更新于 2026/02/10 1458 字 阅读约 3 分钟

提交勘误/建议