云原生与 Kubernetes 阶段:围绕容器编排与平台基础能力,先后发布《Kubernetes 架构与生态》《Cloud Native Go》《云原生 Java》《云原生模式》《云原生基础架构》等。
什么是 AI 原生基础设施?
为 AI 系统重新设计的基础设施 — 而非从云原生堆栈改造而来。
- 非确定性 AI 工作负载本质上是非确定性的
- 智能体优先 智能体,而非服务,成为主要执行单元
- 一等资源 GPU、上下文和 token 成为一等资源
- 治理优于部署 调度与治理比部署更重要
研究证据:写作时间线与研究方法
从一线问题到系统化表达,持续写作是我验证与迭代 AI 原生基础设施方法论的方式。
写作时间线
服务网格与微服务阶段:聚焦治理与流量体系,持续完善《Istio 基础教程》《迁移到云原生应用架构》《Istio 最佳实战》《简明 Envoy 教程》等实践路径。
AI Native Infra 与 AI 阶段:形成 AI 工程到基础设施的方法论,推出《RAG 应用开发与实战手册》《智能体设计模式》《智能体构建指南》《Kubernetes 中的 GPU 调度与虚拟化手册》《AI 原生基础设施》《AI 基础设施之道》等。
研究方法卡片
问题先行
从真实生产问题出发,再抽象概念与模型,避免空泛技术叙事。
系统化拆解
把复杂主题拆成资源模型、运行时、平台工程与治理四个层次。
可验证表达
每个结论尽量对应可验证案例、开源项目或工程指标。
长期迭代
文章、图书与演讲互相校验,持续修正观点并更新实践边界。
出版物与长期著作
覆盖云原生、AI 原生基础设施与智能体系统的长期写作与出版项目,作为方法论的系统化产出。
AI 开源全景图
把方法论落到工具与项目:面向开发者持续更新的 AI 开源资源导航。
探索 AI 资源列表
按分类浏览智能体、AI 编程工具、模型基础设施与工程实践相关的开源资源。
查看 AI 资源列表最新实践文章
最近发布的工程实践与思考更新,延续前述研究主线。
从信息架构、首页设计、社区展示、案例沉淀、博客体验、移动端适配到搜索能力,这次重构不是简单“换皮”,而是一次围绕 HAMi 社区影响力与文档可用性的系统升级。
在 GTC 2026 前夜,从 NVIDIA 的 AI Five-Layer Cake、智能体运行时的兴起,到 AI 原生基础设施,重新思考 AI 是否正在成为新的基础设施。
核心技术领域
研究范围概览:用三条主线界定 AI 原生基础设施的实践边界。
AI 原生
我关注 GPU 虚拟化、推理与智能体的运行时与工程抽象,思考如何把能力稳定高效交付到生产环境。
云原生
我研究 Kubernetes 在 AI 负载下的边界与演进方向,包括资源调度、弹性伸缩与多租户治理。
开源开放
我以工程师视角参与并推动 AI 原生基础设施开源生态,重视可验证、可演进的设计与协作方式。
关于宋净超(Jimmy Song)
Jimmy 长期聚焦 AI 原生基础设施与算力治理,持续研究 GPU 虚拟化、异构调度与系统级架构设计等工程问题。现任 Dynamia 密瓜智能 开源生态 VP,同时是 CNCF Ambassador 与 云原生社区(中国) 发起者,长期推进从云原生走向 AI 原生的工程实践。









