AI 原生基础设施 & 智能体运行时
通过写作、出版与工程实践,系统化构建 AI 原生基础设施与智能体运行时的工程方法论。
什么是 AI 原生基础设施?
为 AI 系统重新设计的基础设施 — 而非从云原生堆栈改造而来。
- 非确定性 AI 工作负载本质上是非确定性的
- 智能体优先 智能体,而非服务,成为主要执行单元
- 一等资源 GPU、上下文和 token 成为一等资源
- 治理优于部署 调度与治理比部署更重要
核心技术领域
这些方向构成我持续研究的主线,重点在可落地的工程抽象与实践边界。
AI 原生
我关注推理、RAG 与智能体的运行时与工程抽象,思考如何把能力稳定交付到生产环境。
云原生
我研究 Kubernetes 在 AI 负载下的边界与演进方向,包括资源调度、弹性伸缩与多租户治理。
开源开放
我以工程师视角参与并推动 AI 原生基础设施开源生态,重视可验证、可演进的设计与协作方式。
出版物与长期著作
覆盖云原生、AI 原生基础设施与智能体系统的长期写作与出版项目。这些出版物共同构成我对 AI 原生基础设施与智能体运行时的系统性工程思考。

AI 原生基础设施:为不确定性而设计的系统
为 CTO、CEO 与平台/基础设施负责人打造的 AI 原生基础设施小册子,系统定义概念、架构、治理与迁移路径,适合用作组织共识与决策框架。

智能体构建指南
覆盖 AI 原生基础设施、RAG、MCP、上下文工程、提示词、智能体架构与运行时语义,形成智能体开发的系统化工程体系,支持可扩展、可治理的 AI 应用构建。

机器学习系统教程
系统呈现把机器学习模型投入生产,构建人工智能系统所需的工程方法与实践。
代表性写作
记录我在 AI × 云原生方向的研究与思考,从工程实践到架构抽象。

2025 年度回顾
回顾 2025 年本站的主要变更:从云原生向 AI 原生基础设施转型,新增 AI 原生基础设施书籍、AI 工具生态、Agent 设计模式等内容,同时大幅优化网站功能和用户体验。

AI 2026:基础设施、Agent 与下一次云原生变革
2026 年 AI 的转折点:不是模型,而是基础设施、Agentic Runtime、GPU 效率与新型组织形态。

Agentic AI Foundation 与 AI 原生标准化
解析 Agentic AI Foundation(AAIF)的成立背景、战略紧迫性、与 CNCF/CNAI 的差异及分工,以及其对 AI 原生时代的深远意义。
关于 Jimmy Song
我长期研究 AI 原生基础设施与智能体运行时,关注推理、RAG、平台工程与系统治理等工程化问题,目标是让智能体能力在生产环境中可交付、可演进。我目前在 Dynamia 密瓜智能 担任开源生态 VP,同时也是 CNCF Ambassador 与 AI 基础设施架构师,并发起了 ArkSphere(面向 AI 原生基础设施的工程共同体)。
