MCP 代码执行模式：提升智能体的效率与可扩展性

智能体的工程化进化，离不开代码执行模式的突破——让 AI 真正具备开发者级别的自治与扩展性。

模型上下文协议（MCP, Model Context Protocol）代码执行模式正在重塑智能体架构，从“模型驱动”走向“代码驱动”。最初 MCP 主要用于标准化模型与外部工具的通信，但随着工具数量与复杂度提升，传统的直接调用工具（Direct Tool Call）模式逐渐暴露出效率与扩展性的极限。

“代码执行模式（Code Execution with MCP）”的提出，是智能体系统工程化的关键里程碑。它让智能体从“调用一堆工具”转变为“编写、执行、复用代码片段”，具备真正的工程化能力。

传统 MCP 工具调用的瓶颈

随着 MCP 服务器数量增加（如文件系统、数据库、浏览器、CRM 等），智能体通常面临两类性能瓶颈：

工具定义过多，吞噬上下文窗口。主机会在推理前加载所有工具定义，当工具数达到上百甚至上千时，模型上下文被大量工具声明填满，推理速度降低，Token 成本显著上升。
工具调用结果反复回流模型。每次工具执行后，结果都需注入模型上下文，导致 Token 使用翻倍、输出容易出错（长文本截断、结构丢失）、上下文窗口耗尽，任务中断。

从“调用工具”到“执行代码”的根本解决方案

为突破上述限制，MCP 社区引入了代码执行模式（Code Execution）。核心思路是：

智能体不再在上下文中携带所有工具定义，而是以代码的方式调用工具，在沙箱中完成执行与数据处理。

例如，每个 MCP 工具被映射为文件系统模块，调用方式变为：

const transcript = (await gdrive.getDocument({ id: "abc123" })).content;
await salesforce.updateRecord({
  objectType: "SalesMeeting",
  recordId: "00Q...",
  data: { Notes: transcript }
});

这样，模型只需一次决定调用逻辑，代码在本地执行，不再把每个中间结果传回 LLM。实际效果：

Token 消耗从 150,000 减少到约 2,000（降低 98%）
执行速度提升数倍
调用结构更清晰、更可调试

代码执行模式的核心特性

代码执行模式具备以下关键能力：

按需加载（Progressive Disclosure）：模型只读取任务相关工具与接口定义，无需加载所有 MCP 工具。

数据在沙箱中处理：数据仅在隔离的执行环境中流动，模型只接收必要摘要。例如：

const rows = await gdrive.getSheet({ id: "abc123" });
const pending = rows.filter(r => r.Status === "pending");
console.log(pending.slice(0, 5));

模型仅看到前五行内容而非全部数据。

支持复杂控制流：支持循环、条件、错误捕获等结构，无需模型逐步指令执行，大幅提升任务吞吐量。例如：

while (true) {
  const msgs = await slack.getChannelHistory();
  if (msgs.some(m => m.text.includes("deployment complete"))) break;
  await sleep(5000);
}

隐私增强（PII Tokenization）：沙箱自动将敏感数据脱敏，模型在推理时不接触真实个人信息。
```
real_email → [EMAIL_1]
phone → [PHONE_1]
name → [NAME_1]
```
可持久化与复用的技能（Skills）：智能体可将常用代码保存为复用模块，形成企业级 AI 能力库。
```
skills/
└── save-sheet-as-csv.ts
```

与 AI Infra / Agent 架构结合的价值

代码执行模式为智能体平台带来更低成本与更强扩展性。通过在沙箱中执行逻辑，企业可安全连接上百个系统（DevOps、监控、CRM 等），而 Token 成本保持可控。工具规模从 10 到 1000 时，智能体性能仍然稳定。

此外，代码执行模式原生适配 LangChain / LangGraph，节点可直接将 MCP 工具映射为 code-execution 节点，实现可视化编排、模型调用压缩与全链路可观测。

从 Direct Tool Call 到 Code Execution 的演进

下表对比了传统 Tool Call 与 Code Execution 模式的核心差异：

维度	传统 Tool Call	Code Execution 模式
Token 成本	高	低（节省约 98%）
工具数量	受限	可扩展至上千
隐私保护	弱	强（数据脱敏）
执行方式	模型直接推理	代码沙箱验证
控制流	仅线性指令	支持条件与循环
可组合性	有限	完全模块化

表 1: Tool Call 与 Code Execution 模式对比

总结

MCP 的代码执行模式标志着智能体从自然语言调用工具迈向可编程、可观测的智能系统。它在工程与架构层面实现了以下转变：

模型 → 编译器
工具 → 模块
Prompt → 代码
调用 → 执行

未来的智能体将不再只是调用接口，而是以代码为中心构建复杂行为。Code Execution with MCP 不是优化技巧，而是 AI Infra 的新底座——让智能体真正具备开发者级别的可扩展性与自治能力。

参考文献

Code Execution with MCP - anthropic.com

创建于 2025/11/06 更新于 2025/11/08 1496 字阅读约 3 分钟

核心内容

核心内容

技术专栏