从 GPU 到 Token:AI 基础设施的八层可观测性体系
从 GPU 硬件、Kubernetes 调度、推理引擎到 Token 成本,理解现代 AI 基础设施的八层可观测性架构。
人工智能工程、大模型、智能体应用与实践。
从 GPU 到 Token:AI 基础设施的八层可观测性体系
从 GPU 硬件、Kubernetes 调度、推理引擎到 Token 成本,理解现代 AI 基础设施的八层可观测性架构。
我如何用 ChatGPT、OpenClaw、Obsidian、GitHub、飞书、GLM-5.1 和 Mac mini M4 构建一套个人 AI 基础设施。
Kubernetes 正在成为 AI 时代的 GPU Control Plane
观察 AI 基础设施控制面演化的几个趋势,聚焦 HAMi v2.9、GPU 调度和 Kubernetes 资源模型。
当 GPU 走向开放调度:HAMi 2025 年的结构性转变
解析 GPU 开放调度的结构性变革,聚焦 DRA/CDI 标准、GPU 虚拟化数据平面、开源生态与反锁定风险。
从 AI 资源列表中移除并整理的 AI 学习资源合集:Awesome 列表、课程、教程和 Cookbook。这些教育材料值得特别关注。
在 ChatGPT 和 TensorFlow 之前,有 Hadoop、Kafka 和 Kubernetes。本文致敬那些成为当今 AI 革命基石的传统开源基础设施。
探讨 Agent-Driven Development(ADD)时代,Spec 如何成为 AI 软件工程的可治理核心资产,以及工程系统的控制平面化趋势。
亲身体验 Verdent 独立 Mac 应用,探索并行 AI agent、隔离工作区和以任务为中心的工作流如何改变真实开发实践。
Manus 被 Meta 收购引发的舆论撕裂:朋友圈祝福、评论区质疑。本文从目标用户、收入来源与增长范式变化出发,讨论 AI 应用时代的蝴蝶效应与对创业者的启示。
基于个人 2025 年度回顾与行业观察,我认为软件工程的核心正在发生结构性转移:从以代码为中心,转向以运行时可控性与成本治理为中心。AI 与 Agent 的普及,并没有削弱工程价值,而是把工程复杂性上移到了运行时、算力与预算层。
从云原生到 AI 原生:Kubernetes 如何承载下一代 AI Agent
从云原生演进视角出发,系统阐述为什么 AI Agent 需要 Kubernetes 级别的基础设施,以及如何通过 Agent 编排、MCP 服务化与 AI 原生网关,构建真正生产级的 AI 原生架构。
2026 年 AI 的转折点:不是模型,而是基础设施、Agentic Runtime、GPU 效率与新型组织形态。