Agent Skill:智能体能力的标准化尝试

草稿

能力的标准化,是智能体生态走向工程化的必经之路。Agent Skill 的出现,让“能力”不再藏在 prompt,而成为可发现、可复用的工程制品。

Agent Skill 是对早期 SKILL.md 模式的一次彻底演进。它不再只是 Claude 的内部机制,而是由 Anthropic 推动、面向整个生态的 Agent 能力封装标准。通过 Agent Skill,“智能体能做什么”被从 prompt 和代码中抽离出来,变成一个 可发现、可加载、可复用的能力包

SKILL.md 的局限性

在智能体(Agent)早期,SKILL.md 主要解决了“如何在上下文受限的情况下,把流程性知识教给 Claude”这一局部问题。

但随着 Agent 进入工程化阶段,需求发生了根本变化:

  • 能力不再只服务于单一模型(如 Claude)
  • Agent 不再局限于单一产品形态
  • 能力需要跨 IDE、CLI、Agent Runtime 等多环境复用
  • Prompt 成为能力分发的瓶颈

Agent Skill 的核心定义

Agent Skill 可以理解为 Agent 的“能力制品格式(Capability Artifact)”。

一个 Skill 是一个目录,包含:

  • SKILL.md(能力入口与说明)
  • 可选脚本(如 Python、JavaScript 等)
  • 可选资源与文档

Agent 可以在需要时动态加载 Skill,而不是在 prompt 里硬编码。

这种设计,将 Agent 能力从 Prompt Engineering 推进到 Specification Engineering。

Agent Skill 在体系中的定位

在智能体技术体系中,Agent Skill 并不是 Agent Framework、Agent Runtime 或 Tool API。它关注的是更基础的问题:能力如何被描述、打包和分发

下表帮助理解 Agent Skill 在各领域的定位:

领域对应物
容器OCI Image
KubernetesCRD
WebOpenAPI
AgentAgent Skill
表 1: 各领域能力标准类比

大厂为何快速跟进 Agent Skill

Agent Skill 的重要性不在于“好不好用”,而在于其对分层标准的抢占。

一旦能力层被标准化,真正的竞争就会下沉到 Runtime、Sandbox、调度与成本模型。

因此你会看到:

  • Claude Code 原生支持 Agent Skills
  • VS Code、IDE 类工具开始加载 Skill 目录
  • OpenAI Codex 的能力结构高度趋同
  • 各类 Agent IDE(如 Cursor、Goose、OpenCode)快速适配

这些现象并非巧合,而是标准正在逐步形成的信号。

Agent Skill 的工程化用法

在实际工程中,Agent Skill 的使用方式已高度工程化:

  • 本地目录即能力源:将 Skill 放入约定目录(如 .skills/),IDE 或 Agent 启动时自动发现。
  • 隐式优先:Agent 根据描述自行判断是否加载 Skill。
  • 显式兜底:在 Codex 或 IDE 中可手动指定某个 Skill。
  • 脚本即能力落点:复杂、确定性的操作交由脚本完成,模型负责决策与编排。

这种机制让 Skill 同时适用于 AI IDE(如 Copilot、VS Code)、CLI Agent(如 Codex)以及长生命周期的 Agent Runtime。

Agent Skill 与传统 SKILL.md 的本质区别

过去我们关注“如何用 SKILL.md 教模型做事”,而现在 Agent Skill 更强调其作为 Agent 世界能力接口标准的定位。

关键转变在于:

  • 过去:SKILL.md 是技巧
  • 现在:Agent Skill 是分层架构的一部分

你说得对:现在这章解释了“是什么、为什么”,但缺了“到底怎么用”。下面给你一个可直接插入到当前章节中的「Agent Skill 如何使用」精简小节,不偏文档、不写长段落,偏工程直觉与实际操作。

Agent Skill 是如何被“用起来”的

Agent Skill 并不是你在 prompt 里“调用”的东西,而是 Agent 在运行时自动加载的能力源。 使用它,本质上只做三件事。

第一步:把 Skill 放到 Agent 能看到的地方

Skill 的载体不是 API,而是目录。

典型结构:

.skills/
└── pptx/
    ├── SKILL.md
    └── scripts/
        └── generate_ppt.py

只要这个目录存在于 Agent / IDE 约定的位置:

  • Claude Code
  • VS Code (Copilot / Codex)
  • CLI Agent (Codex CLI, OpenCode)

Agent 启动时就会自动扫描并注册这些能力

这一步没有“安装命令”,文件系统本身就是能力注册表

第二步:Agent 如何决定“用不用这个 Skill”

Agent Skill 的调用遵循一个明确但不显式的流程:

图 1: Agent Skill 调用流程
图 1: Agent Skill 调用流程

关键点只有一个:

Agent 只会先读 SKILL.md 顶部的 description。

如果 description 告诉 Agent:

“当用户提到 PPT / 幻灯片 / presentation 时使用我”

那 Skill 就会被加载。

第三步:模型做判断,脚本做确定性工作

Agent Skill 强制了一种分工:

  • 模型负责:

    • 判断是否使用 Skill
    • 规划步骤
    • 组织语言与结构
  • 脚本负责:

    • 文件生成
    • 数据处理
    • 调用系统工具

例如 PPT Skill:

  • 模型:决定每一页写什么
  • generate_ppt.py:真正生成 .pptx 文件

这一步非常关键:

Agent Skill 的目标不是“让模型更聪明”, 而是让模型少干它不擅长的事

在 VS Code / Copilot / Codex 中的真实体验

在 IDE 中,Agent Skill 的使用是无感的

  • 你只说需求:“帮我做一个 10 页的技术分享 PPT”

  • Agent:

    • 自动匹配 pptx Skill
    • 读取 Skill 中的结构规范
    • 调用脚本生成文件
  • 你得到结果,而不是 prompt

在 Codex / CLI Agent 中,多一个兜底机制:

  • 可以显式指定:$pptx
  • 强制 Agent 使用某个 Skill

一个最小可用心智模型

如果你只记住一句话:

Agent Skill = Agent 的外挂能力目录,不是一个 prompt 技巧。

它的使用方式永远是:

放目录 → 写好描述 → 让 Agent 自己用

总结

Agent Skill 的意义不在于其是否完美,而在于它标志着一个行业共识正在形成:

Agent 的能力,不应继续藏在 prompt 里。

当能力标准化之后,Runtime、Sandbox、资源调度与成本模型等基础设施,才真正有了发展的前提。

Agent Skill 不负责执行环境

  • 不管 sandbox
  • 不管权限
  • 不管成本
  • 不管 GPU

它只回答一个问题:

“这个能力长什么样,什么时候该被用?”

而下面一章要回答的,正是:

“能力在哪里跑、谁来管、怎么算钱、怎么限权?”

参考资料

创建于 2025/10/26 更新于 2025/12/21 2041 字 阅读约 5 分钟