第 3 章:AI 应用开发框架
本章系统梳理了 AI 应用开发的主流框架与智能体范式,帮助开发者理解从单智能体到分布式多智能体的演进路径,掌握消息驱动与协同开发等关键工程实践。
智能体的定义与主流开发范式
本节介绍智能体(Agent)的基本定义及主流开发范式,帮助读者建立智能体应用的整体认知。
什么是智能体
我们可以将智能体(Agent)理解为一个具备自主理解、规划、记忆和工具使用能力的数字化实体。想象一个高度智能的个人助理,你只需告诉他“帮我规划一次去北京的周末旅行”,他就能自主完成以下任务:
- 感知(Perception):理解用户的自然语言指令。
- 规划与推理(Planning & Reasoning):借助模型推理能力,将任务拆解为查询往返机票、筛选酒店、规划景点路线、预估预算等子任务。
- 记忆(Memory):记住你之前的偏好,比如喜欢靠窗的座位、偏爱的经济型酒店。
- 工具(Tool):调用外部工具,如机票预订 API、酒店查询系统、地图服务等,来执行这些子任务。
- 反馈与迭代(Feedback & Iteration):将规划好的行程草案反馈给你,并根据你的修改意见进行调整,最终完成预订。
智能体让 AI 从一个只会内容生成的语言模型,进化成一个具备自主规划能力的行动者。
智能体的主流开发范式
随着智能体技术的不断成熟,业界出现了多种有效的智能体开发范式。根据解决问题的场景与复杂度,主流智能体应用开发范式大致分为以下几种:
- 简单 LLM 应用:直接调用模型 API 实现内容生成,完全依赖模型服务。
- 单智能体:为 LLM 应用增加 RAG、Tool、Memory 等能力,使模型具备与特定环境交互的能力。
- 工作流(Workflow):将应用拆分为多个独立子智能体,并按照预定义流程编排,适合复杂业务场景。
- 多智能体系统(Multi-Agent):采用模型驱动、对话式流程编排,各子智能体协作完成复杂目标,具备更高的自主决策权。
接下来将围绕单智能体、工作流、多智能体系统三种核心开发范式展开,讲解其核心设计理念。
单智能体
Augmented LLM Application 旨在弥补大模型预训练特性的局限性,如无法获取最新数据、无法调用本地工具、无状态等。典型单智能体架构如下图所示。
下图展示了单智能体架构的基本模式:

单智能体架构的高级性依赖于底层模型能力,但在实际应用中,模型能力有限,单智能体模式面临工具选择、上下文膨胀、任务复杂度和可维护性等挑战。因此,业界设计了工作流和多智能体系统等模式来弥补模型能力不足。
工作流
工作流是一种编排模式,将复杂任务拆解为有序步骤,强调流程的确定性和可控性。常见工作流包括链式工作流(Chain)和路由工作流(Routing)。
链式工作流
链式工作流将复杂任务分解为一系列子任务,每一步由独立的 LLM 调用完成,上一阶段输出作为下一阶段输入。
下图展示了链式工作流的结构:

路由工作流
路由工作流通过对输入进行分类,将其分派到专门的下游任务或处理路径,实现关注点分离与精准响应。
下图展示了路由工作流的结构:

多智能体系统
多智能体系统采用自治协作模式,由多个具备自治能力的 Agent 组成,每个 Agent 有独立角色和能力,通过消息或上下文交互协同完成复杂目标。
这种方式更接近团队合作,适合任务边界不清晰、需动态规划的场景,如研究型问答、复杂数据分析等。其挑战在于交互和决策路径高度动态,难以预测和调试。
开发一个简单的智能体
本节以 Spring AI Alibaba 框架为例,介绍如何快速定义和实现一个功能完备的智能体。
智能体框架选型
智能体开发生态最初以 Python 为主,后逐步拓展到 Java 等语言。Spring AI Alibaba 等 Java 框架为开发者提供了丰富的智能体开发能力。
Spring AI Alibaba 中的 Agent 定义
Spring AI Alibaba 中的 Agent 定义为 React Agent,是典型的 ReAct 模式实现。ReAct 通过“思考 - 行动 - 观察”循环动态解决复杂问题。
下图展示了 ReAct 循环的具体步骤:

循环步骤包括:
- 思考(Thought):分析任务目标、已有信息和可用工具,生成推理过程或计划。
- 行动(Action):调用外部工具,生成结构化指令。
- 观察(Observation):执行工具调用,将结果反馈给智能体。
- 循环迭代:结合观察结果和任务目标,进入新一轮思考,直至任务完成。
示例代码与 AgenticAPI
快速定义一个简单的 Agent
定义智能体需明确以下基础配置:
- Name(名称):唯一标识符,建议具备描述性。
- Description(描述):简要说明能力,便于多智能体协作时区分。
- Model(模型):指定底层大语言模型,如 “qwen-max”。
引导 Agent 行为(设置 Prompt 提示词)
instruction 参数用于引导智能体行为,包括:
- 核心任务或目标
- 性格或角色(Persona)
- 行为约束
- 工具使用说明
- 输出格式要求
编写 instruction 时应清晰具体,可用 Markdown 格式和示例增强可读性。
高级设置:配置工具与模型参数
工具赋予智能体超越模型预训练数据的能力。可通过原生函数、API 或其他智能体实例为 Agent 配置工具,提升其与业务系统的集成能力。
工作流与多智能体
本节介绍如何通过多智能体架构应对复杂业务场景,重点讲解 Spring AI Alibaba 框架下的多智能体类型与工作流实现。
Spring AI Alibaba 中的多智能体类型
下图展示了 Spring AI Alibaba 中 Agent 的类继承关系:

| 类型 | ReactAgent | FlowAgent | MultiAgent |
|---|---|---|---|
| 核心特性 | 推理、生成、工具使用 | 控制多个智能体流程 | 控制多个智能体流程 |
| 流程编排 | 无 | 预定义流程(串行、并行等) | 支持大模型决策的流程控制 |
| 确定性 | 较高不确定性 | 较高确定性 | 介于 ReactAgent 和 FlowAgent 之间 |
工作流-SequentialAgent
SequentialAgent 依次执行多个子 Agent,上一个 Agent 的输出作为下一个 Agent 的输入。
下图展示了 SequentialAgent 的典型架构:

示例:文章协作助手,包含 writer_agent、reviewer_agent 两个子智能体,通过 SequentialAgent 串联。
工作流-ParallelAgent
ParallelAgent 并行执行多个子 Agent,适合多领域任务协同。
下图展示了 ParallelAgent 的架构:

示例:智能搜索助手,包含多个领域子 Agent,并通过 MergerAgent 合并输出,最终用 SequentialAgent 串联。
下图为智能搜索助手的总体架构:

工作流-LoopAgent
LoopAgent 循环执行子 Agent,适合需要多轮迭代的任务。
下图展示了 LoopAgent 的架构:

多智能体系统-LlmRoutingAgent
LlmRoutingAgent 通过模型决策下一个子智能体走向,适合动态流程控制。
下图展示了 LlmRoutingAgent 的基本架构:

从单进程到分布式部署
本节介绍智能体从单进程到分布式部署的演进,重点解析 A2A 协议及其在分布式智能体系统中的应用。
下图展示了分布式智能体架构的演进趋势:

什么是 A2A 协议
A2A 协议是一项开放标准,旨在实现异构智能体间的高效通信与协作。其核心角色包括用户、A2A 客户端和 A2A 服务端。
A2A 协议的主要元素有:
- Agent Card(智能体卡片):JSON 格式元数据,描述智能体能力和服务端点。
- Task(任务):支持多轮交互的状态化任务。
- Message(消息):单次通信的基本单元。
- Artifact(产出物):任务完成后的实体化结果。
- Part(内容块):消息或产出物的最小内容单元。
A2A 支持轮询、流式传输和推送通知三类交互机制。
A2A 协议的工作流
A2A 协议的工作流程分为三步:
- 发现 A2A Server 的 AgentCard。
- 进行授权和权限认证。
- 发起 A2A 请求(同步或流式)。
下图展示了 AgentCard 发现流程:

下图展示了 A2A 授权与认证流程:

下图展示了同步请求流程:

下图展示了流式请求流程:

基于 NacosA2ARegistry 的自动注册与发现
AgentCard 是远端 Agent 的数字名片,A2AClient 通过解析 AgentCard 实现智能体发现。AgentCard 的获取方式包括直接配置、固定 URI 和注册中心。
下图展示了直接配置方式:

下图展示了固定 URI 方式:

NacosA2A 注册中心
Nacos 作为 A2A 协议的注册中心,统一管理 Agent 的注册、发现和检索能力。
下图展示了 NacosA2A 注册中心架构:

Nacos 支持 Agent 版本管理和灰度发布,提升分布式智能体系统的可维护性和扩展性。
下图展示了 Nacos 在 Agent 应用中的多重角色:

消息驱动的智能体开发模式
本节介绍消息驱动在 AI 应用中的关键作用,重点分析 RocketMQ 在 AI 场景下的创新架构与调度能力。
消息模型提升 AI 通信效率
AI 应用交互具有长耗时、多轮次和高算力成本等特点。传统消息队列难以满足 AI 场景下的高并发、长会话和大消息体需求。
下图展示了基于 RocketMQ 的轻量化消息架构:

RocketMQ 针对 AI 场景优化了百万级 Lite-Topic 支持、自动管理、大消息体传输和严格顺序保障。
下图展示了消费分发策略:

基于消息驱动的智能化资源调度
RocketMQ 通过优先级与配额机制,实现流量削峰填谷、定速消费和智能资源分配。
下图展示了资源调度架构:

基于统一元数据的 AI 协同开发模式
AI 时代的协同开发可基于统一元数据,打通产品、设计、前后端等多角色协作流程,提升开发效率。
下图展示了统一元数据驱动的协同开发流程:

| 层级 | 主要内容 |
|---|---|
| 智能协作层 | 需求解析→智能校验→冲突检测 |
| 物料规范层 | Design Token 库→语义化组件→API 契约 |
| 转换引擎层 | 文生图→图生代码→代码重构→接口联调 |
| 基础数据层 | 结构化 PRD→设计系统→接口规范 |
在 AI 时代,团队可通过统一物料库和智能工具链,实现需求、设计、开发、测试等环节的高效协同。
总结
本章系统梳理了 AI 应用开发的主流框架与智能体范式,涵盖从单智能体到多智能体、分布式部署、消息驱动与协同开发等关键内容。理解并合理运用这些开发模式,将为构建高效、可扩展的 AI 原生应用奠定坚实基础。