OpenKruise Agents

开源运维与资源管理套件，帮助在 Kubernetes 上快速构建可休眠的智能体沙箱并降低 GPU 成本。

OpenKruise · Since 2025-11-26

正在加载评分...

详细介绍

OpenKruise Agents 是 OpenKruise 社区推出的智能体沙箱生命周期管理组件，通过 Kubernetes Operator 和自定义资源定义（CRD, Custom Resource Definition）提供声明式工作流，覆盖资源申请、分配、回收与会话治理。它聚焦云上 AI 研发团队常见的 notebook、桌面和强化学习沙箱场景，支持快速弹性、低冷启动和跨 GPU 的状态保留。借助云原生基础设施，它把智能体运行时和底层算力解耦，方便研发、平台与运维团队协同。在此基础上，项目提炼了一组面向智能体的核心特性。

主要特性

以下特性帮助团队更快落地沙箱化的智能体工作负载。

资源池化与动态扩缩：通过多租户资源池、按需实例化和弹性回收降低 GPU 与存储成本。
沙箱休眠与检查点：支持内存、可写层与 GPU 显存的休眠/唤醒，缩短重复启动时间并提升体验。
身份与会话管理：内置用户身份、流量路由与会话保持能力，减少对 Kubernetes Service 组合的依赖。
API 与 SDK 统一：同时提供 Kubernetes CRD API 与 E2B SDK，方便平台工程与应用代码双向集成。这些能力直接映射到研发和运维团队的典型需求。

使用场景

项目当前适配的主要使用场景包括：

科研 Notebook 与开发桌面：为算法与应用工程师提供可网络访问、可持久化的交互式沙箱。
强化学习与人类反馈训练：支持人类在环和开放环境测试，保障长周期任务的稳定与复现。
大规模数据训练与调优：通过快速启动与资源自动回收提升多任务排班效率。为了支撑上述场景，底层技术实现也做了针对性优化。

技术特点

在技术层面，OpenKruise Agents 具备以下特点：

基于 Kubernetes 控制面：使用 Operator 模式协调多组件状态，确保可观测、可审计与可回滚。
可插拔沙箱实现：内置沙箱 API 并兼容 Sig Agent-Sandbox，实现不同运行时的平滑切换。
多租户安全隔离：提供网络、身份与数据隔离策略，便于在同一集群安全托管多团队负载。

OpenKruise Agents

详细介绍

主要特性

使用场景

技术特点

评分详情

相关资源

claude-code-tools

Awesome Claude Code Subagents

Worktrunk