用 Kubernetes 老兵听得懂的类比,讲透 token、模型、训练、推理、Transformer、Tensor Core、HBM、KV Cache 到底是什么,以及为什么 AI 非跑在 GPU 上不可。
Kubernetes
从 GPU 利用率到 Productive GPU-Hours,AI Infra 的效率升级。
从 GPU 到 Token:AI 基础设施的八层可观测性体系
从 GPU 硬件、Kubernetes 调度、推理引擎到 Token 成本,理解现代 AI 基础设施的八层可观测性架构。
Token 不只是计费单位,它正在成为 AI 时代的新资源单位
最近 Linux Foundation 宣布成立 Tokenomics Foundation。这个基金会的意义可能不在于它会不会定义新的标准,而在于它隐含承认了一件事:Token 已经开始成为一种资源,就像 CPU 在云时代那样。
Kubernetes 正在成为 AI 时代的 GPU Control Plane
观察 AI 基础设施控制面演化的几个趋势,聚焦 HAMi v2.9、GPU 调度和 Kubernetes 资源模型。
在 KubeCon EU 2026 中,我感受到 Kubernetes 与 AI 浪潮的焦虑与变化。这篇文章深入探讨了 Kubernetes 在 AI 时代的挑战与未来发展机遇。
KubeCon Europe 2026 第一日观察:Kubernetes 如何适应 AI 基础设施浪潮,以及 GPU 资源层的演进趋势。
当 GPU 走向开放调度:HAMi 2025 年的结构性转变
解析 GPU 开放调度的结构性变革,聚焦 DRA/CDI 标准、GPU 虚拟化数据平面、开源生态与反锁定风险。
在 ChatGPT 和 TensorFlow 之前,有 Hadoop、Kafka 和 Kubernetes。本文致敬那些成为当今 AI 革命基石的传统开源基础设施。