阅读《智能体构建指南》,了解我对 AI 原生基础设施与智能体运行时的工程思考。

从空间数据到 AI 开源:技术标准、数据主权与全球化的分野

本文以苹果地图和天气中空气质量数据的呈现差异为切入点,探讨技术标准与数据主权如何影响不同国家的 AI 开源路径,并分析基础设施级开源为何成为生态主导权的关键战场。

技术标准与数据主权的分野,决定了 AI 时代基础设施开源的全球竞争格局。

在本文中,我将以苹果地图和天气中空气质量数据的呈现差异为切入点,探讨技术标准与数据主权如何影响不同国家的 AI 开源路径,并进一步分析在 AI 时代,基础设施级开源为何成为生态主导权的关键战场。

作者按

这篇文章源自一个非常日常的观察:为什么在苹果地图和天气里,中国的空气质量数据是“点状”的,而其他国家往往是“面状”的。

图 1: Apple Weather 中的空气质量地图,从中可以看到中国的数据是点,而其他一些国家是面
图 1: Apple Weather 中的空气质量地图,从中可以看到中国的数据是点,而其他一些国家是面

起初它看起来像是产品体验差异,但当我把这个问题放到工程、标准和系统设计的语境下重新审视时,发现它其实指向一个更大的问题:不同国家如何理解技术、标准、开放与主权之间的关系。

作为一名长期从事云原生、AI 基础设施与开源生态工作的工程师,我逐渐意识到,这种差异并不只存在于空气质量或地图数据中,而是在 AI 时代被进一步放大,直接影响着我们如何开源模型、如何构建基础设施、以及是否能够参与全球规则的制定。

写下这篇文章,并不是为了评判对错,而是试图用一个具体而微的例子,解释一种结构性的差异,并讨论在 AI 时代,这种差异可能带来的长期影响与现实机遇。

尤其重要的是:在 AI 基础设施与 Infra 级开源这一层面,竞争才刚刚开始。中国并非没有机会,但路径选择将变得比以往任何时候都更加关键。

空气质量数据的呈现差异:技术标准与主权的缩影

下图展示了空间数据、AI 开源与技术标准的分野。通过对比不同国家在苹果地图和天气中空气质量数据的呈现方式,可以直观感受到背后技术标准与主权策略的不同。

图 2: 空间数据、AI 开源与技术标准的分野
图 2: 空间数据、AI 开源与技术标准的分野

如果你长期使用全球化产品,比如地图、天气、交通或各类数据服务,可能会注意到一个反复出现、却很少被认真讨论的现象:中国的数据呈现方式,往往与全球主流标准存在明显差异。

一个非常直观的例子,来自苹果地图或苹果天气中的空气质量展示。在中国,空气质量通常以一个一个离散的点呈现;而在美国、欧洲、日本等国家,它往往被渲染成连续覆盖的区域。

乍一看,这像是产品体验的差异,甚至会让人误以为“中国的数据不完整”。但如果把它当作一个工程问题、一个系统设计问题来思考,就会发现:这并不是数据能力的问题,而是技术标准、数据主权与开放策略的不同选择。

而这种选择,并不只体现在空气质量上。

空气质量只是切片:更大的差异在空间型公共数据

空气质量只是一个高度可见、风险相对较低的例子。类似的差异,长期存在于更广泛的空间型与公共数据领域。

  • 地图与坐标体系
  • 测绘与高精度空间数据
  • 实时交通与人口流动
  • 遥感、环境、城市运行数据

在全球主流体系中,这类数据通常被视为公共信息基础设施。它们被标准化、网格化、API 化,允许插值、建模和再分发,并被广泛用于科研、商业和产品创新。

而在中国,这些数据往往呈现出另一种形态:分级、离散、口径严格、解释权集中。

这不是单一领域的技术偏好,而是一种系统性的技术与治理逻辑。

全球视角下的三种路径

将中国放入全球坐标系,可以看到在“公共数据与技术标准如何开放”这个问题上,全球大致存在三种不同路径。

工程开放型:标准与生态优先

以美国及部分欧美国家为代表,这类体系的核心特征是:

  • 公共数据优先作为基础设施
  • 标准与接口先行
  • 鼓励工程自治与生态演化
  • 容忍模型推断与不确定性

这一路径直接塑造了全球基础软件与基础设施级开源格局。Linux、Kubernetes、云原生体系,本质上都是规则层开放的产物。

治理主权型:可控与可审计优先

以中国为代表,这一路径更强调:

  • 空间与公共数据的敏感性
  • 数据首先是治理能力的一部分
  • 标准、口径、发布方式高度绑定
  • 强调可追溯、可问责、可控

在这种体系中,“点状数据”并不是技术落后,而是一种可治理的技术形态。当一个技术系统被设计为治理系统时,它的首要目标并不是可复用性,而是可控性。

折中协调型:谨慎开放、工程国际化

还有一些国家试图在两者之间寻找平衡,在空间数据上保持谨慎,在工程与产业层面高度国际化。它们说明了一点:差异并非先进或落后,而是目标函数不同。

下图从全球视角对比了这三种路径的核心特征、典型案例及其优势与挑战。左侧的“工程开放型”通过标准与生态主导了全球基础软件格局;中间的“治理主权型”强调数据主权与安全可控,但在规则层影响力上存在局限;右侧的“折中协调型”试图在安全与开放之间寻求平衡。这三种路径的分野,直接影响着各国在 AI 时代的基础设施竞争格局。

图 3: 全球视角:公共数据与技术标准开放的三种路径
图 3: 全球视角:公共数据与技术标准开放的三种路径

空气质量“点”与“面”的本质

在所有空间型公共数据中,空气质量是一个非常理想的观察窗口:

  • 不直接涉及军事或核心经济安全
  • 高度可见、每日更新、人人可感知

中国并不缺空气质量数据,恰恰相反,监测站密度处于全球领先水平。真正的差异在于:

  • 是否允许插值
  • 是否允许模型推断
  • 是否允许平台进行二次解释

“点”意味着真实、可追溯;“面”意味着模型、推断与解释权的再分配。这正是技术标准与数据主权的分水岭。

下图对比了两种不同的技术路径:左侧的“治理主权型”强调数据的可追溯性和可控性,采用离散的点状数据呈现;右侧的“工程开放型”则允许模型插值和推断,通过连续的面状区域提供更友好的用户体验。这种差异的本质不在于技术能力的高低,而在于对数据主权、治理能力与开放生态之间权衡的不同选择。

图 4: 空间数据呈现方式的技术标准与主权分野
图 4: 空间数据呈现方式的技术标准与主权分野

AI 时代的放大效应

理解了上述逻辑,很多 AI 时代的现象就不再令人困惑。

例如:

  • 为什么中国的 AI 公司更愿意开源大语言模型(LLM)权重,而美国公司近几年却明显转向闭源?
  • 为什么基础软件与基础设施级开源,依然主要由美国主导?

关键不在“开不开源”,而在于“开源到哪一层”。

  • 模型权重,是静态、可声明的资产
  • 基础设施、运行时、协议与标准,是动态、可演化的系统规则

开源权重,本质上是资产层的开放;而基础设施级开源,意味着对运行规则与解释权的让渡。

下图对比了 AI 开源的两个不同层次。左侧展示的是“模型权重层开源”,这是中国路径的典型特征——开放静态的数字资产,成本低且风险可控,但不涉及运行规则的制定。右侧展示的是“基础设施层开源”,这是美国路径的核心策略——通过开放开发工具、协议标准、运行时和算力调度等基础设施,定义 AI 的使用方式,从而掌握生态规则与解释权。关键洞察在于:开源模型权重不等于掌握 AI 生态,真正的竞争焦点正在向“AI 如何运行”的基础设施层转移。

图 5: AI 时代开源的两个层次:模型权重 vs 基础设施
图 5: AI 时代开源的两个层次:模型权重 vs 基础设施

美国的选择:主攻规则层与运行层

过去一两年,美国主导的 AI 开源与生态动作展现出高度一致的方向:并不急于开源最强模型,而是集中定义“AI 如何被使用”。

  • Linux Foundation 新成立 AAIF(Agentic AI Foundation),重点放在 AI 基础设施、标准与工具链协作
  • 以 MCP(Model Context Protocol)为代表的协议,试图定义 Agent 与工具、系统的通用交互方式
  • 大型科技公司普遍把重心放在 API、平台、运行时与生态绑定上

这些动作的共同点是:竞争模型能力,但掌控使用规则。

中国的变化:从模型导向走向基础设施导向

需要强调的是,这种差异,并不意味着中国没有意识到问题。

无论是在政策讨论层面,还是在产业与研究机构内部,“只开源模型而不掌握基础设施与标准主导权”的风险,早已被反复讨论。

真正的难点在于,如何在既有治理逻辑与风险框架下,完成方向性的转向。而这种转向,已经在一些具体实践中出现。

基础设施层的探索与实践

在 AI 时代,基础设施往往从最工程化的问题开始。

HAMi 项目

HAMi 这类项目关注的并不是模型能力,而是:

  • GPU 资源的抽象、分配与隔离
  • 多租户 AI 工作负载的运行方式
  • 算力如何从硬件资产转变为可治理系统资源

这类项目的意义不在于“是否 SOTA”,而在于它们开始进入“AI 如何运行”的问题域。

系统软件视角的 AI Runtime 重构

研究机构层面的探索同样值得关注。智源研究院推动的 FlagOS,本身就是一个清晰信号:AI 正在被重新视为系统软件问题,而不仅是模型或算法问题。

产业级玩家的长期技术栈投入

在产业界,华为的策略也体现出类似方向:不是简单开源模型,而是尝试构建完整、可控的 AI 技术栈,从算力到框架,再到平台与生态。这是一条更慢、更重,但更接近基础设施级竞争的路径。

现实判断:AI 基础设施竞争的起点

把视角拉长,会发现一个容易被忽略的事实:

在 AI 基础设施与 Infra 级开源这个层面,中美之间并不存在一个已经尘埃落定的格局。

美国的优势在于:

  • 成熟的工程文化
  • 标准组织与基金会机制
  • 对规则层开放的高度熟练

而中国的变量在于:

  • 巨大的 AI 应用场景
  • 对算力与系统效率的极端需求
  • 正在发生的方向性调整

真正的不确定性不在于“能不能追上”,而在于:是否能够在保持治理底线的前提下,逐步释放工程自治与标准共建的空间。

总结

空气质量的“点”与“面”、模型权重与运行世界,这些表象背后指向的,从来不是简单的技术路线之争,而是一个国家如何在开放、标准与主权之间,寻找自己的平衡点。

AI 时代,这个问题不会消失,只会变得更加具体、更加工程化。而这,正是中国 AI 基础设施开源仍然存在机遇的地方。

宋净超(Jimmy Song)

宋净超(Jimmy Song)

专注 AI 原生基础设施、智能体运行时与算力治理的系统级架构设计。

文章导航