检查清单(10 问)
已发行
以下 10 个问题用于判断组织是否具备 AI 原生基础设施的战略与执行准备。下图将问题分为战略、治理、执行三类,便于会议讨论。
- 你能否把每个主要 AI 工作负载的 单位成本 定义清楚(例如:每 1M tokens、每次 agent 任务、每个 batch 作业)?
- 你是否具备 预算/配额机制,能把团队/项目/租户的算力消耗限制在可控范围?
- 你是否能在“性能(吞吐/时延)—成本—风险”之间做显式的政策选择(而不是靠口头约束)?
- 你的平台是否能处理 不确定性:峰值、长尾、agent 路径爆炸导致的资源波动?
- Agent/MCP 的“意图”是否被映射到 可执行且可计费/可审计的资源后果?
- 你是否有明确的 资源隔离与共享策略(同卡共享、显存隔离、抢占、优先级)来提升利用率?
- 你能否做到跨层可观测:从 请求/agent → runtime → GPU/网络/存储 → 成本 的端到端链路?
- 你的基础设施是否支持快速引入新硬件/互连/拓扑变化(异构与演进是常态)?
- 组织层面是否建立了 “AI SRE / ModelOps + FinOps” 的协作机制与责任边界(谁为成本与可靠性负责)?
- 当你说“我们是 AI-native”,你是否能在一页纸上给出 三平面 + 一闭环 的架构图与治理策略?
参考文献
- Harvard Business Review - AI Strategy
- MIT Sloan - Executive Guide to AI
- World Economic Forum - AI Governance
广告
智谱 AI GLM Coding 超值订阅
Claude Code、Cline 等 20+ 大编程工具无缝支持,码力全开。