第十届中国开源年会,12月6-7日,北京, 查看详情

AnyTool

AnytTool 是实现自反(self-reflective)分层智能体的开源实现,用于大规模 API 调用与评测。

详细介绍

AnyTool 是论文《AnyTool: Self-Reflective, Hierarchical Agents for Large-Scale API Calls》的开源实现,旨在构建具自反能力与分层决策的智能体,用于在大规模 API 调用场景中自动选择、组合与验证多种接口。项目包含用于准备 ToolBench 数据、预处理脚本与实验流水线,支持在本地或云上复现实验结果,并提供评估脚本来计算论文中使用的通过率指标。

主要特性

  • 自反(self-reflective)策略:智能体在决策过程中进行自检与迭代以提高执行质量。
  • 分层架构:将决策分层为检索、规划与求解器,便于扩展与替换模块。
  • 工具与数据支持:集成 ToolBench 数据集与 AnyToolBench 示例数据,包含预处理与生成脚本。
  • 可复现实验:提供完整实验命令与结果输出路径,方便复现论文中的评测。

使用场景

  • 多接口调用任务:需要在海量 API 中选择并组合多个接口以完成复杂查询时。
  • 研究与评估:作为评测自反智能体和比较不同检索/求解策略的基线实现。
  • 教学与复现:用于学习分层智能体设计与复现实验结果的教学资源。
  • 工具集成原型:快速搭建调用多 API 的代理原型并进行性能验证。

技术特点

  • 面向 API 的检索与调度流水线,支持大规模工具集合的索引与调用。
  • 结合现代 LLM(如 GPT-4)与自研求解器实现联合求解与验证流程。
  • 提供数据预处理、AnyToolBench 生成与评估脚本,便于复现实验与对比研究。
  • 采用 Apache-2.0 许可,便于研究与企业采用。
AnyTool
资源信息
🌱 开源 🤖 智能体框架 🛠️ 开发工具