草稿

智能体状态语义:Session、Task 与 Execution Graph

智能体的本质是“可推进的状态机”,理解状态语义是构建 Agentic Runtime 的前提。

智能体的核心不是“执行”,而是“状态推进”

在 AI 原生时代,执行单元已从函数和容器转变为“携带状态、持续演化的智能体(Agent)”。理解智能体的状态语义(State Semantics,状态语义)是构建 Agentic Runtime 的基础,比模型、框架、Prompt 更为关键。

本节将构建一个可工程化、可实现、可推理的智能体状态模型,涵盖以下核心抽象:

  • Session(会话态,Session State)
  • Task(任务态,Task State)
  • State Progression(状态推进,State Progression)
  • Team(多智能体结构,Team)
  • Execution Graph / Task Graph(执行图/任务图,Execution Graph / Task Graph)
  • Planner / Worker / Evaluator(角色语义,Planner / Worker / Evaluator)

目标是为后续的运行时语义、治理模型和多智能体系统奠定统一抽象。

会话态(Session State)

会话态(Session State,Session State)是智能体运行时最小的连续性单位。它不是传统意义上的 HTTP Session,也不是聊天窗口,而是一种具备以下属性的运行态容器:

  • 长生命周期(Long-lived)
  • 可演化上下文(Evolving Context)
  • KV Cache 紧密绑定(Model-Driven State)
  • 可被调度器暂停/恢复(Active / Idle)
  • 可以承载多个 Task、工具、记忆、推理链路

Session 是 Agent 的主内存空间,不是业务意义上的“对话”,而是运行时意义上的连续执行状态机。

Session state 包含:

  • Context Snapshot(当前可见的上下文)
  • Inference State(KV cache、partial output)
  • Tool State(工具执行历史)
  • Interaction Trace(推理轨迹)
  • Task Queue(待执行任务)
  • Memory(短记忆 + 长记忆接口)

如果没有 Session,Agent 仅是“函数调用 + 模型响应的组合”,缺乏持续性与演化能力。

任务态(Task State)

任务态(Task State,Task State)是智能体执行模型的第二个核心抽象。Task 不是 API,也不是一个函数,而是一个可推进的过程(Process-like Entity,过程型实体)。

Task 的关键属性包括:

  • 明确的目标(Goal)
  • 状态机(State Machine:Waiting / Planning / Executing / Reviewing / Completed / Failed)
  • 工具链路(Tool Chain)
  • Planner 输出计划
  • Worker 执行动作
  • Evaluator 检查结果

Task 的存在,使 Agent 具备“推进任务”的能力,而不仅仅是“生成一句话”。Task 也不是“对话轮次(Turn)”,而是一种 runtime-level 的执行对象,可以跨多轮推理、多次工具调用、多阶段输出。

状态推进(State Progression)

智能体的核心在于“如何从一个状态推进到下一个状态”。下面用一个最小推进循环说明状态演化过程:

  1. 模型在当前 Session 中推理出下一步意图(Plan)
  2. 运行时解析意图生成 Task Plan
  3. 执行工具(Action)或子任务
  4. 运行时采集执行结果进入 Session
  5. Evaluator 判断是否需要继续
  6. 回到第 1 步,直到 Task 收敛

这一循环称为 Plan → Act → Observe → Evaluate → Next State。

传统软件是“函数调用 → 返回值”,而智能体执行是“状态推进 → 状态推进 → 状态推进”。因此,所有 Agentic Runtime 都需要:

  • Task State
  • Session State
  • Execution Trace
  • Evaluator
  • Tool Execution Gateway

缺乏状态推进机制的框架,难以称为完整的 Runtime。

Team:多智能体结构

团队结构(Team,Team)是智能体系统中的协作抽象。Team 并非“群聊”,而是一组具备不同角色或能力的 Agent,通过协作完成复杂任务。

Team 的本质特征包括:

  • 角色分化(Role Specialization)
  • 协作关系(协作模式而非函数调用)
  • 治理能力(权限、审计、调度、隔离)
  • 推理链路透明性(可观测)

Session 可以共享(Shared Session),也可以隔离(Detached Session),团队内有 Task Master / Planner / Worker / Evaluator 等角色,并拥有一个共享的 Task Graph。协作通过“状态推进”实现,而非 RPC 或事件总线。这与微服务之间的显式 API 调用完全不同。

Execution Graph / Task Graph(执行图)

执行图(Execution Graph / Task Graph,执行图/任务图)是智能体系统的“执行真相”,描述任务之间的依赖关系(DAG)、工具执行节点、模型推理节点、分支、合并、回溯(backtracking)、失败重试与恢复点。

下面是一个简化的 DAG 示例,用于说明智能体任务的结构化执行:

图 1: 智能体任务执行图
图 1: 智能体任务执行图

Task Graph 让 Agent 从“聊天机器人”变成“工作流执行体”,是 Agentic Runtime 的关键能力。没有 Task Graph 的系统,难以实现结构化智能体执行。

Planner / Worker / Evaluator(角色语义)

智能体系统中的三种角色不是工程模式,而是运行时的真实执行语义。下文分别介绍三者的职责:

Planner — 决定下一步做什么

  • 读取 Session 状态
  • 推理出下一步策略计划
  • 输出 Task Plan(DAG fragment 或 Action)

Planner 决定系统的“智能性”。

Worker — 执行具体动作

  • 工具调用
  • 子任务执行
  • 代码执行(通过 Sandbox)

Worker 决定系统的“行动能力”。

Evaluator — 判断是否结束

Evaluator 判断:

  • 是否达到目标
  • 是否需要重新规划
  • 结果是否可信(Hallucination Check)
  • 是否需要进一步执行

Evaluator 决定系统的“收敛能力”。

三者共同构成 Agent 的基本执行循环,实现智能体的持续演化。

总结

智能体的本质是“可推进的状态机”,而非一段 Prompt、一个聊天窗口、一个函数或一个微服务。它具备会话状态、任务状态、执行图结构、推理能力和工具行动能力,是长期运行的智能实体。

要构建 Agentic Runtime,必须先构建:

  • Session State(连续性)
  • Task State(目标推进)
  • Execution Graph(结构化执行)
  • Planner–Worker–Evaluator(角色语义)
  • Team(协作语义)
  • 状态推进(核心循环)

这是 AI 运行时系统的最小语义闭环,也是下一代应用架构的根基。