AI 原生基础设施 & 智能体运行时
通过写作、出版与工程实践,系统化构建 AI 原生基础设施与智能体运行时的工程方法论。
什么是 AI 原生基础设施?
为 AI 系统重新设计的基础设施 — 而非从云原生堆栈改造而来。
智能体 / AI 应用
智能体运行时与上下文
推理 · 训练 · 治理
GPU 与加速基础设施
- 非确定性 AI 工作负载本质上是非确定性的
- 智能体优先 智能体,而非服务,成为主要执行单元
- 一等资源 GPU、上下文和 token 成为一等资源
- 治理优于部署 调度与治理比部署更重要
核心技术领域
这些方向构成我持续研究的主线,重点在可落地的工程抽象与实践边界。
AI 原生
我关注推理、RAG 与智能体的运行时与工程抽象,思考如何把能力稳定交付到生产环境。
云原生
我研究 Kubernetes 在 AI 负载下的边界与演进方向,包括资源调度、弹性伸缩与多租户治理。
开源开放
我以工程师视角参与并推动 AI 原生基础设施开源生态,重视可验证、可演进的设计与协作方式。
代表性写作
记录我在 AI × 云原生方向的研究与思考,从工程实践到架构抽象。

2025 年度回顾
回顾 2025 年本站的主要变更:从云原生向 AI 原生基础设施转型,新增 AI 原生基础设施书籍、AI 工具生态、Agent 设计模式等内容,同时大幅优化网站功能和用户体验。

AI 2026:基础设施、Agent 与下一次云原生变革
2026 年 AI 的转折点:不是模型,而是基础设施、Agentic Runtime、GPU 效率与新型组织形态。

Agentic AI Foundation 与 AI 原生标准化
解析 Agentic AI Foundation(AAIF)的成立背景、战略紧迫性、与 CNCF/CNAI 的差异及分工,以及其对 AI 原生时代的深远意义。
关于 Jimmy Song
我长期研究 AI 原生基础设施与智能体运行时,关注推理、RAG、平台工程与系统治理等工程化问题,目标是让智能体能力在生产环境中可交付、可演进。我目前在 Dynamia 密瓜智能 担任开源生态 VP,同时也是 CNCF Ambassador 与 AI 基础设施架构师,并发起了 ArkSphere(面向 AI 原生基础设施的工程共同体)。



