AI 正在悄然重塑基础设施格局,GTC 2026 或许将成为这一变革的关键节点。
下周,全球 AI 行业最重要的技术大会之一 NVIDIA GTC 2026 将在美国圣何塞举行。
对很多人来说,GTC 只是一个 GPU 技术大会。但如果你持续关注过去几年 AI 行业的发展,就会发现一个很有意思的现象:
很多 AI 基础设施的重要叙事,都是在 GTC 上逐渐形成的。
从 CUDA、DGX,到 AI Factory,再到最近 Jensen Huang 提出的 AI Five-Layer Cake,NVIDIA 正在不断试图重新定义 AI 时代的计算基础设施。
这也是为什么很多人把 GTC 称为:
AI 的“Woodstock”。

今年的 GTC(3 月 16 日—19 日)预计会覆盖 AI stack 的各个层面,包括:
- AI 芯片
- AI 数据中心
- AI Agent
- 机器人
- 推理计算
根据 NVIDIA 官方博客 的介绍,今年的 keynote 将重点讨论 从芯片到应用的完整 AI stack。
如果把这些信号放在一起,其实能看到一个更大的趋势:
AI 正在从“应用技术”,变成“基础设施”。
工业革命的视角
从更长的时间尺度来看,人类历史上的技术革命,本质上都是基础设施的革命。
通常我们把工业革命划分为四次。
在下表中,可以看到每次工业革命对应的基础设施:
| 工业革命 | 基础设施 |
|---|---|
| 蒸汽革命 | 蒸汽机 |
| 电气革命 | 电网 |
| 数字革命 | 计算机 |
| 互联网时代 | 网络 |
第一次工业革命:蒸汽
蒸汽机让人类第一次能够大规模利用机械动力。生产不再依赖人力或动物,而是依赖机器。
第二次工业革命:电力
电力改变的不只是动力来源,还改变了生产组织方式。流水线、规模化制造、现代工业体系,都建立在电网基础之上。
第三次工业革命:计算机
计算机让信息可以被数字化处理。软件成为生产工具。
第四次工业革命:互联网与智能化
互联网把所有计算机连接在一起。云计算把计算资源变成基础设施。而 AI,则让机器开始具备一定程度的“认知能力”。
AI 的真正意义
如果观察这些工业革命,会发现一个规律:
每一次工业革命都会产生一种新的 通用基础设施(General Purpose Infrastructure)。
而 AI,很可能会成为下一代基础设施。
NVIDIA 在最近的文章中甚至直接提出:
AI is essential infrastructure, like electricity and the internet.
换句话说:
AI 不再只是一个应用技术,而是一个 新的生产要素。
NVIDIA 的 Five-Layer Cake
最近 Jensen Huang 提出了一个非常有意思的概念:AI Five-Layer Cake。

AI 被拆解为五个层次:
- Energy
- Chips
- AI Infrastructure
- Models
- Applications
这个模型其实说明了一件事情:
AI 是一个完整的产业体系。
Jensen Huang 在 Davos 甚至把 AI 描述为:
“人类历史上最大规模的基础设施建设之一。”
GTC 2026 可能释放的几个信号
今年的 GTC 预计会释放几个重要方向。
推理计算
过去 AI 的重点是训练。但未来 AI 的主要负载很可能是 推理(Inference)。
分析师预计,到 2030 年 AI 数据中心市场中 75% 的算力需求来自推理。
Agentic AI
过去 AI 的模式是:
User → Model → Answer
而 Agent 的模式则更为复杂:
User → Agent → Tools → Model → Action
下方流程图展示了 Agent 模式下的主要交互路径:
AI 不再只是回答问题,而是 执行任务。
Agent 平台
最近有媒体报道称 NVIDIA 可能会推出一个新的 Agent 平台:NemoClaw,目标是帮助企业部署 AI Agent。
如果这个项目真的发布,那意味着 NVIDIA 的 stack 会变成如下结构:
这其实就是一个完整的 AI stack。
Agent 改变计算负载
Agent 的出现带来了新的计算负载问题。
过去 AI workload 主要是:
- Training
- Inference
但 Agent 带来第三种 workload:
Agent Workloads
下图展示了 Agent 相关的多样化负载类型:
这种 workload 的特点是 高度碎片化。GPU 不再是被长时间占用,而是大量小请求。这对基础设施提出了新的挑战。
AI 原生基础设施
过去几年,我一直在思考一个问题:
什么是 AI 原生基础设施?
它显然不只是“带 GPU 的 Kubernetes”。我更倾向于认为它需要具备几个特征。
GPU 是一等资源
云计算时代,CPU 是核心资源。AI 时代,GPU 是核心资源。
异构算力
现实世界的 AI 芯片并不只有 NVIDIA:
- NVIDIA
- 华为昇腾
- 寒武纪
- 沐曦
- 摩尔线程
- 其他专用 AI 芯片
未来的 AI 基础设施必须能够管理 异构算力。
GPU 共享
GPU 是一种非常昂贵的资源。如果不能共享,利用率会非常低。这也是为什么 GPU virtualization 和 slicing 变得越来越重要。
AI 调度
AI 调度不仅包括传统的 CPU、Memory,还包括:
GPU
VRAM
Topology
Bandwidth
一个可能的 AI 技术栈
结合上述趋势,未来 AI stack 可能会呈现如下结构:
这个结构与 NVIDIA 的 Five-Layer Cake 十分接近。
我的判断
综合 GTC、AI Factory、Agent、AI Five-Layer Cake 等信号,可以看到一个非常明显的趋势:
AI 正在重写计算基础设施。
未来的竞争很可能不只是“谁拥有最好的模型”,而是:
谁拥有最好的 AI Infrastructure。
就像过去几十年:
- 电力决定工业能力
- 互联网决定信息能力
- 云计算决定软件能力
未来可能是:
AI Infrastructure 决定智能能力。
总结
如果把时间尺度再拉长一点,我们或许正处在一个新的历史阶段。
AI 不再只是一个技术工具。它正在变成 新的基础设施。
就像:
- 电力
- 互联网
- 云计算
一样。
而 AI 原生基础设施,很可能会成为未来十年最重要的技术方向之一。
