AI 原生基础设施

推动面向不确定性的 AI 原生基础设施落地与演进。

非确定性 智能体优先 一等资源 治理优于部署

关于宋净超(Jimmy Song)

什么是 AI 原生基础设施?

为 AI 系统重新设计的基础设施 — 而非从云原生堆栈改造而来。

智能体 / AI 应用
智能体运行时与上下文
推理 · 训练 · 治理
GPU 与加速基础设施
  • 非确定性 AI 工作负载本质上是非确定性的
  • 智能体优先 智能体,而非服务,成为主要执行单元
  • 一等资源 GPU、上下文和 token 成为一等资源
  • 治理优于部署 调度与治理比部署更重要

研究证据:写作时间线与研究方法

从一线问题到系统化表达,持续写作是我验证与迭代 AI 原生基础设施方法论的方式。

写作时间线

2017-2022

云原生与 Kubernetes 阶段:围绕容器编排与平台基础能力,先后发布《Kubernetes 架构与生态》《Cloud Native Go》《云原生 Java》《云原生模式》《云原生基础架构》等。

2022-2024

服务网格与微服务阶段:聚焦治理与流量体系,持续完善《Istio 基础教程》《迁移到云原生应用架构》《Istio 最佳实战》《简明 Envoy 教程》等实践路径。

2025-Now

AI Native Infra 与 AI 阶段:形成 AI 工程到基础设施的方法论,推出《RAG 应用开发与实战手册》《智能体设计模式》《智能体构建指南》《Kubernetes 中的 GPU 调度与虚拟化手册》《AI 原生基础设施》《AI 基础设施之道》等。

研究方法卡片

问题先行

从真实生产问题出发,再抽象概念与模型,避免空泛技术叙事。

系统化拆解

把复杂主题拆成资源模型、运行时、平台工程与治理四个层次。

可验证表达

每个结论尽量对应可验证案例、开源项目或工程指标。

长期迭代

文章、图书与演讲互相校验,持续修正观点并更新实践边界。

AI 开源全景图

把方法论落到工具与项目:面向开发者持续更新的 AI 开源资源导航。

持续更新

探索 AI 资源列表

按分类浏览智能体、AI 编程工具、模型基础设施与工程实践相关的开源资源。

查看 AI 资源列表

最新实践文章

最近发布的工程实践与思考更新,延续前述研究主线。

HAMi 官网改版说明

从信息架构、首页设计、社区展示、案例沉淀、博客体验、移动端适配到搜索能力,这次重构不是简单“换皮”,而是一次围绕 HAMi 社区影响力与文档可用性的系统升级。

核心技术领域

研究范围概览:用三条主线界定 AI 原生基础设施的实践边界。

AI 原生

AI 原生

我关注 GPU 虚拟化、推理与智能体的运行时与工程抽象,思考如何把能力稳定高效交付到生产环境。

云原生

云原生

我研究 Kubernetes 在 AI 负载下的边界与演进方向,包括资源调度、弹性伸缩与多租户治理。

开源开放

开源开放

我以工程师视角参与并推动 AI 原生基础设施开源生态,重视可验证、可演进的设计与协作方式。

关于宋净超(Jimmy Song)

Jimmy 长期聚焦 AI 原生基础设施与算力治理,持续研究 GPU 虚拟化、异构调度与系统级架构设计等工程问题。现任 Dynamia 密瓜智能 开源生态 VP,同时是 CNCF Ambassador 与 云原生社区(中国) 发起者,长期推进从云原生走向 AI 原生的工程实践。

Jimmy Song's Avatar