智能体作为 Workload:从代码实体到可治理执行单元

已完成

只有将智能体建模为可调度的 Workload,才能真正纳入云原生治理,实现安全、可观测与高效协作。

在 Agentic Runtime 体系中,“Agent 是什么”这个问题已经有了明确答案

Agent 是一种可调度、可治理、可审计的 Workload,而不是代码结构。

如果一个智能体(Agent)仍然只能以 class、SDK 实例或进程内对象的形式存在,那么它往往只能停留在 Demo 阶段,难以进入企业级生产环境。

为什么 Agent 必须是 Workload

Workload(工作负载)是云原生体系中最重要的抽象之一。它关注的核心并非“代码怎么写”,而是:

  • 谁在运行
  • 运行多久
  • 消耗什么资源
  • 如何被调度
  • 如何被回收和治理

这些问题,正是 Agent 系统在实际落地时无法回避的关键挑战。

一个真实的智能体具备如下属性:

  • 长生命周期:Session、Memory、Context 持续存在
  • 非确定执行路径:推理循环与任务分解动态发生
  • 多资源消耗:Token、KV Cache、GPU、IO、工具配额
  • 强治理需求:权限、成本、安全、审计
  • 可中断与可恢复:失败是常态,而非异常

这些属性共同指向一个结论:

治理对象必须是“执行单元”,而不是代码本身。

因此,Agent 必须被建模为 Workload。

Workload 不是容器,而是执行语义

在云原生语境下,容器只是 Workload 的一种实现方式,而非定义本身。

在 Agentic Runtime 中,Workload 的本质是一段可治理的执行过程,它至少包含以下要素:

  • 执行边界(Execution Boundary)
  • 资源声明(Resource Contract)
  • 生命周期(Lifecycle)
  • 状态语义(Session / Task / Trace)
  • 调度与回收策略

容器、Sandbox(受控执行域)、MicroVM(微型虚拟机)、Wasm(WebAssembly)等,都是承载这种语义的不同载体。

Agent Workload 的常见载体形态

不同的底层载体代表了不同的执行语义与治理能力。下表总结了主流载体的适用场景与特点。

载体类型适用场景主要特点
容器(Container)Agent Worker、Planner、MCP Tool Server生态成熟、可观测性完善、易于集成 Kubernetes,隔离强度有限
Sandbox(受控执行域)浏览器自动化、代码执行、文件与系统操作行为级权限控制、强隔离、可审计执行轨迹
MicroVM(如 Firecracker)企业级高隔离、多租户、高风险工具链虚拟机级隔离、启动速度快、安全边界清晰
Wasm(WebAssembly)规则执行、轻量 Agent、内部 DSL Runtime无系统调用、高可移植性、极低启动成本
托管执行(Hosted Runtime)无需自建基础设施、轻量工具执行执行语义不可控、治理能力受限
表 1: Agent Workload 常见载体形态与适用场景

在 Agentic Runtime 中,Sandbox 是执行域,而不是“工具容器”,强调行为级权限和可审计性。

RuntimeClass:用声明式方式选择执行语义

Kubernetes 体系通过 RuntimeClass 提供了一种声明式选择 Workload 执行环境的能力。

通过声明而非代码,决定 Workload 的执行环境。

下表展示了典型 RuntimeClass 及其承载形式和适用场景:

RuntimeClass承载形式适用场景
runc标准容器通用 Agent
gvisor沙箱容器受控工具执行
kata / firecrackerMicroVM高隔离企业场景
wasm32-wasiWasm轻量规则与 DSL
表 2: 常见 RuntimeClass 类型与适用场景

Agentic Runtime 可以根据任务类型、风险级别、资源需求,动态选择 RuntimeClass,而不是在代码中硬编码执行方式。

调度重点:Agent 的资源不是 CPU

与传统 Pod 调度不同,Agent 的核心调度资源并非 CPU,而是推理与工具相关资源。

下方列表总结了 Agentic Runtime 关注的主要资源类型:

  • 推理资源:如 GPU、KV Cache、Batch Slot
  • 工具资源:如 Sandbox、Tool Executor
  • 状态资源:如 Session Memory、Execution Graph
  • 协作资源:如多 Agent DAG 依赖

Kubernetes 主要负责节点与基础资源的分配、隔离与生命周期管理,而 Agentic Runtime 则聚焦于语义调度、推理与工具协同、状态推进。这构成了一个双层调度模型

Agent 的 CRD:以资源定义语义

当 Agent 被建模为 Workload 后,其治理对象转变为资源对象。下表列举了典型的 Agentic Runtime CRD 及其作用:

CRD作用
Agent能力、Prompt、工具、权限声明
Session长生命周期上下文
Task / Query一次执行请求
Tool工具能力与沙箱绑定
Eval审计、评测与审批
表 3: Agentic Runtime 典型 CRD 及其作用

通过 CRD,Agent 生命周期可控、权限可治理、执行可回放、成本可约束,智能体正式进入云原生治理体系。

Workload 是 Sandbox 与执行图的连接点

Workload 在智能体系统中起到结构性纽带作用:

  • 执行图(Execution Graph)定义“要做什么”
  • Sandbox 定义“在哪里做”
  • Workload 定义“谁在做,以及如何被治理”

如果缺少 Workload 抽象,执行图无法被调度,Sandbox 难以统一治理,状态也无法绑定到具体执行实体。Workload 是三者之间的关键连接点。

总结

在 Agentic Runtime 体系下:

  • 智能体必须以 Workload 形式存在,才能纳入云原生治理
  • Workload 承载的是执行语义,而非代码本身
  • 执行环境通过 RuntimeClass 声明,具备灵活性
  • 调度以推理与工具资源为核心,区别于传统 CPU 调度
  • CRD 是治理与扩展的基础,实现生命周期、权限、成本等多维度可控

Agent 从 class 走向 Workload,不是众多演进路径之一,而是当前实现规模化、可治理与企业级落地的必经之路。

这是智能体系统迈向大规模生产、可治理与企业级应用的前提条件。

创建于 2026/01/01 更新于 2026/01/01 2032 字 阅读约 5 分钟