用 Kubernetes 老兵听得懂的类比,讲透 token、模型、训练、推理、Transformer、Tensor Core、HBM、KV Cache 到底是什么,以及为什么 AI 非跑在 GPU 上不可。
GPU
从 GPU 利用率到 Productive GPU-Hours,AI Infra 的效率升级。
从 GPU 到 Token:AI 基础设施的八层可观测性体系
从 GPU 硬件、Kubernetes 调度、推理引擎到 Token 成本,理解现代 AI 基础设施的八层可观测性架构。
Token 不只是计费单位,它正在成为 AI 时代的新资源单位
最近 Linux Foundation 宣布成立 Tokenomics Foundation。这个基金会的意义可能不在于它会不会定义新的标准,而在于它隐含承认了一件事:Token 已经开始成为一种资源,就像 CPU 在云时代那样。
KubeCon Europe 2026 第一日观察:Kubernetes 如何适应 AI 基础设施浪潮,以及 GPU 资源层的演进趋势。
本文以苹果地图和天气中空气质量数据的呈现差异为切入点,探讨技术标准与数据主权如何影响不同国家的 AI 开源路径,并分析基础设施级开源为何成为生态主导权的关键战场。
正式加入 Dynamia 密瓜智能,开启 AI 原生基础设施新征程
加入 Dynamia 密瓜智能,出任开源生态 VP,负责 AI 原生基础设施生态建设,推动算力从硬件消耗走向核心资产。
基于个人 2025 年度回顾与行业观察,我认为软件工程的核心正在发生结构性转移:从以代码为中心,转向以运行时可控性与成本治理为中心。AI 与 Agent 的普及,并没有削弱工程价值,而是把工程复杂性上移到了运行时、算力与预算层。