控制面治理

草稿

本章聚焦 GPU 资源控制面的治理能力:生态放置法、Kthena 推理调度、Volcano 批处理调度、Kueue 配额准入、以及参考架构的组合,实现从"能调度"到"可运营"的平台升级。

章节目录

生态放置

草稿

用控制面、数据平面、平台层定位 GPUStack 等项目职责与比较口径,避免清单式盘点。

Volcano

草稿

Volcano 作为控制面调度策略引擎,提供队列、fair-share、gang scheduling、抢占等批处理与 AI 作业治理能力,补齐原生 Kubernetes 的调度语义缺口。

Kueue

草稿

Kueue 将 GPU 从节点设备升级为组织治理资源,实现准入、配额、队列化与资源承诺,支撑平台化与可运营性。

组合架构

草稿

本章提出一套可落地的 GPU 资源组合模式,涵盖数据平面与控制面的正交拼装,配套适用场景、复杂度、风险点及验收指标,助力方案评审与落地。

Kthena

草稿

以 Kthena 为例,探讨 LLM 在线推理如何将 GPU 治理从资源分配升级为语义调度,分析控制面与数据面的协同及其对平台治理能力的提升。

创建于 2026/01/10 更新于 2026/01/10 404 字 阅读约 1 分钟