AI Infra 行业趋势观察:从算力瓶颈到生态演进

从一线实践和开源生态角度,分析 AI Infra 核心瓶颈的演变、CPU/GPU/调度的真实角色、云原生开源调度生态演进,以及训练、推理、Agent 等不同场景下的算力需求变化。

本幻灯片从一线实践和开源生态角度出发,系统梳理了 AI Infrastructure 领域的关键趋势:核心瓶颈从"算力稀缺"迁移到"效率治理",GPU 虚拟化与智能调度成为性价比最高的投入方向,云原生生态正在从"应用调度"升级为"算力调度",Agent 场景将催生新一代调度范式。

下方嵌入了交互式幻灯片,您可以使用控制按钮或键盘快捷键进行导航。

幻灯片: AI Infra 行业趋势观察

主要议题

  • AI Infra 核心瓶颈演变 — 从算力稀缺到效率低下再到算力治理
  • CPU / GPU / 调度的真实角色 — 生产环境中各层次算力的定位与协同
  • 云原生 × 开源调度生态 — 从 Cloud Native 到 AI Native 的技术演进
  • 训练 / 推理 / Agent 算力需求 — 不同场景下的资源特征与趋势判断

关于演讲者

Jimmy Song,CNCF Ambassador,云原生社区创始人。长期从事云原生基础设施与 AI 基础设施相关工作,关注 GPU 算力调度、虚拟化及开源生态建设。