第十届中国开源年会,12月6-7日,北京, 查看详情

LaVague

LaVague 是一个开源的 Web Agent 框架,提供多驱动支持与可定制的生成与执行管道。

详细介绍

LaVague 是一个面向开发者的开源框架,用于构建能在 Web 上执行多步骤任务的智能体(Web Agents)。框架将世界模型、动作引擎与驱动(如 Selenium、Playwright 或 Chrome 扩展)结合,能够将高层目标编译为可执行动作并自动运行,从而实现网页自动化与任务执行。

主要特性

  • 多驱动支持:兼容 Selenium、Playwright 与 Chrome 扩展驱动,覆盖不同执行环境。
  • 模块化架构:包含 World Model、Action Engine 与可定制的上下文/配置组件,便于扩展与测试。
  • QA 与示例工具:提供 LaVague QA、演示与快速上手指南,帮助团队快速构建与验证场景。
  • 数据与计量:内置日志、Token 计数与遥测控制,使成本与行为可观测与可控。

使用场景

适用于需要在浏览器上自动执行多步骤任务的场景,如自动化测试、网站数据收集、用户流程自动化与基于网页的工具链集成。关注隐私或本地运行的团队可以利用本地驱动与自托管部署方案。

技术特点

  • 面向工程化:支持模块化插件与配置,便于在 CI/CD 与测试流水线中集成。
  • 可组合的执行管道:将高阶目标转换为动作序列并通过驱动执行,利于复杂任务编排。
  • 开源许可:Apache-2.0 许可,便于审计与企业集成。
  • 文档与示例完善:配套文档站点和 Colab 示例,便于上手与复现。
LaVague
资源信息
🎨 多模态 ⚙️ 自动化 🌱 开源