AI Infrastructure

为什么 GPU 是 AI 的基石

用 Kubernetes 老兵听得懂的类比,讲透 token、模型、训练、推理、Transformer、Tensor Core、HBM、KV Cache 到底是什么,以及为什么 AI 非跑在 GPU 上不可。

Agentic AI 基础设施可靠性

解读 Hesham ElBakoury 的《AI Infrastructure Reliability Features and Architecture for Agentic AI》,从可靠性五维框架、容错、恢复、可观测性到混合架构,分析 Agentic AI 基础设施的设计原则,并从 AI Infra 视角给出评价。

Token 中文之争

从词元、智元到 Token 本身,这场翻译之争背后,其实是语言系统、工程抽象与产业标准之间的深层冲突。