GTC 2026 前夜:AI 正在成为新的基础设施

在 GTC 2026 前夜,从 NVIDIA 的 AI Five-Layer Cake、智能体运行时的兴起,到 AI 原生基础设施,重新思考 AI 是否正在成为新的基础设施。

AI 正在悄然重塑基础设施格局,GTC 2026 或许将成为这一变革的关键节点。

下周,全球 AI 行业最重要的技术大会之一 NVIDIA GTC 2026 将在美国圣何塞举行。

对很多人来说,GTC 只是一个 GPU 技术大会。但如果你持续关注过去几年 AI 行业的发展,就会发现一个很有意思的现象:

很多 AI 基础设施的重要叙事,都是在 GTC 上逐渐形成的。

从 CUDA、DGX,到 AI Factory,再到最近 Jensen Huang 提出的 AI Five-Layer Cake,NVIDIA 正在不断试图重新定义 AI 时代的计算基础设施。

这也是为什么很多人把 GTC 称为:

AI 的“Woodstock”。

图 1: NVIDIA GTC Conference
图 1: NVIDIA GTC Conference

今年的 GTC(3 月 16 日—19 日)预计会覆盖 AI stack 的各个层面,包括:

  • AI 芯片
  • AI 数据中心
  • AI Agent
  • 机器人
  • 推理计算

根据 NVIDIA 官方博客 的介绍,今年的 keynote 将重点讨论 从芯片到应用的完整 AI stack

如果把这些信号放在一起,其实能看到一个更大的趋势:

AI 正在从“应用技术”,变成“基础设施”。

工业革命的视角

从更长的时间尺度来看,人类历史上的技术革命,本质上都是基础设施的革命。

通常我们把工业革命划分为四次。

在下表中,可以看到每次工业革命对应的基础设施:

工业革命基础设施
蒸汽革命蒸汽机
电气革命电网
数字革命计算机
互联网时代网络
表 1: 工业革命与基础设施对应关系

第一次工业革命:蒸汽

蒸汽机让人类第一次能够大规模利用机械动力。生产不再依赖人力或动物,而是依赖机器。

第二次工业革命:电力

电力改变的不只是动力来源,还改变了生产组织方式。流水线、规模化制造、现代工业体系,都建立在电网基础之上。

第三次工业革命:计算机

计算机让信息可以被数字化处理。软件成为生产工具。

第四次工业革命:互联网与智能化

互联网把所有计算机连接在一起。云计算把计算资源变成基础设施。而 AI,则让机器开始具备一定程度的“认知能力”。

AI 的真正意义

如果观察这些工业革命,会发现一个规律:

每一次工业革命都会产生一种新的 通用基础设施(General Purpose Infrastructure)

而 AI,很可能会成为下一代基础设施。

NVIDIA 在最近的文章中甚至直接提出:

AI is essential infrastructure, like electricity and the internet.

换句话说:

AI 不再只是一个应用技术,而是一个 新的生产要素

NVIDIA 的 Five-Layer Cake

最近 Jensen Huang 提出了一个非常有意思的概念:AI Five-Layer Cake

图 2: AI Five Layer Cake(图片来源 <a href="https://blogs.nvidia.com/blog/ai-5-layer-cake/" target="_blank" rel="noopener">NVIDIA</a>)
图 2: AI Five Layer Cake(图片来源 NVIDIA

AI 被拆解为五个层次:

  1. Energy
  2. Chips
  3. AI Infrastructure
  4. Models
  5. Applications

这个模型其实说明了一件事情:

AI 是一个完整的产业体系。

Jensen Huang 在 Davos 甚至把 AI 描述为:

“人类历史上最大规模的基础设施建设之一。”

GTC 2026 可能释放的几个信号

今年的 GTC 预计会释放几个重要方向。

推理计算

过去 AI 的重点是训练。但未来 AI 的主要负载很可能是 推理(Inference)

分析师预计,到 2030 年 AI 数据中心市场中 75% 的算力需求来自推理

Agentic AI

过去 AI 的模式是:

User → Model → Answer

而 Agent 的模式则更为复杂:

User → Agent → Tools → Model → Action

下方流程图展示了 Agent 模式下的主要交互路径:

图 3: Agentic AI 交互流程
图 3: Agentic AI 交互流程

AI 不再只是回答问题,而是 执行任务

Agent 平台

最近有媒体报道称 NVIDIA 可能会推出一个新的 Agent 平台:NemoClaw,目标是帮助企业部署 AI Agent。

如果这个项目真的发布,那意味着 NVIDIA 的 stack 会变成如下结构:

图 4: NVIDIA Agent 平台架构
图 4: NVIDIA Agent 平台架构

这其实就是一个完整的 AI stack。

Agent 改变计算负载

Agent 的出现带来了新的计算负载问题。

过去 AI workload 主要是:

  • Training
  • Inference

但 Agent 带来第三种 workload:

Agent Workloads

下图展示了 Agent 相关的多样化负载类型:

图 5: Agent Workloads 结构
图 5: Agent Workloads 结构

这种 workload 的特点是 高度碎片化。GPU 不再是被长时间占用,而是大量小请求。这对基础设施提出了新的挑战。

AI 原生基础设施

过去几年,我一直在思考一个问题:

什么是 AI 原生基础设施?

它显然不只是“带 GPU 的 Kubernetes”。我更倾向于认为它需要具备几个特征。

GPU 是一等资源

云计算时代,CPU 是核心资源。AI 时代,GPU 是核心资源

异构算力

现实世界的 AI 芯片并不只有 NVIDIA:

  • NVIDIA
  • 华为昇腾
  • 寒武纪
  • 沐曦
  • 摩尔线程
  • 其他专用 AI 芯片

未来的 AI 基础设施必须能够管理 异构算力

GPU 共享

GPU 是一种非常昂贵的资源。如果不能共享,利用率会非常低。这也是为什么 GPU virtualization 和 slicing 变得越来越重要。

AI 调度

AI 调度不仅包括传统的 CPU、Memory,还包括:

GPU
VRAM
Topology
Bandwidth

一个可能的 AI 技术栈

结合上述趋势,未来 AI stack 可能会呈现如下结构:

图 6: AI 技术栈演进
图 6: AI 技术栈演进

这个结构与 NVIDIA 的 Five-Layer Cake 十分接近。

我的判断

综合 GTC、AI Factory、Agent、AI Five-Layer Cake 等信号,可以看到一个非常明显的趋势:

AI 正在重写计算基础设施。

未来的竞争很可能不只是“谁拥有最好的模型”,而是:

谁拥有最好的 AI Infrastructure。

就像过去几十年:

  • 电力决定工业能力
  • 互联网决定信息能力
  • 云计算决定软件能力

未来可能是:

AI Infrastructure 决定智能能力。

总结

如果把时间尺度再拉长一点,我们或许正处在一个新的历史阶段。

AI 不再只是一个技术工具。它正在变成 新的基础设施

就像:

  • 电力
  • 互联网
  • 云计算

一样。

而 AI 原生基础设施,很可能会成为未来十年最重要的技术方向之一。

宋净超(Jimmy Song)

宋净超(Jimmy Song)

专注于 AI 原生基础设施与云原生应用架构的研究与开源实践。

文章导航