Token 背后的 GPU:Kubernetes 如何把算力用满

2026 超云生态沙龙分享,讲解 Kubernetes 环境下 GPU 算力调度与共享的最佳实践,涵盖 HAMi 项目及 GPU 切分、显存隔离等核心技术。

本次演讲来自 2026 年超云生态沙龙,深入讲解了 Kubernetes 环境下 GPU 算力的调度与共享方案,重点介绍了 CNCF 沙箱项目 HAMi 的架构设计与实际应用。

下方嵌入了交互式幻灯片,您可以使用控制按钮或键盘快捷键进行导航。

幻灯片: Token 背后的 GPU:Kubernetes 如何把算力用满

主要议题

  • GPU 算力现状 — 大模型时代 GPU 资源的供需矛盾
  • Kubernetes GPU 调度挑战 — 原生设备插件的局限性
  • HAMi 项目介绍 — CNCF 沙箱项目的架构与能力
  • GPU 切分与共享 — 显存隔离、算力分配的技术实现
  • 生产实践 — 企业级 GPU 共享方案的落地经验

演讲详情

  • 活动: 超云生态沙龙
  • 日期: 2026 年 5 月 25 日
  • 演讲者: 宋净超
  • 组织: 超云