详细介绍
LaVague 是一个面向开发者的开源框架,用于构建能在 Web 上执行多步骤任务的智能体(Web Agents)。框架将世界模型、动作引擎与驱动(如 Selenium、Playwright 或 Chrome 扩展)结合,能够将高层目标编译为可执行动作并自动运行,从而实现网页自动化与任务执行。
主要特性
- 多驱动支持:兼容 Selenium、Playwright 与 Chrome 扩展驱动,覆盖不同执行环境。
- 模块化架构:包含 World Model、Action Engine 与可定制的上下文/配置组件,便于扩展与测试。
- QA 与示例工具:提供 LaVague QA、演示与快速上手指南,帮助团队快速构建与验证场景。
- 数据与计量:内置日志、Token 计数与遥测控制,使成本与行为可观测与可控。
使用场景
适用于需要在浏览器上自动执行多步骤任务的场景,如自动化测试、网站数据收集、用户流程自动化与基于网页的工具链集成。关注隐私或本地运行的团队可以利用本地驱动与自托管部署方案。
技术特点
- 面向工程化:支持模块化插件与配置,便于在 CI/CD 与测试流水线中集成。
- 可组合的执行管道:将高阶目标转换为动作序列并通过驱动执行,利于复杂任务编排。
- 开源许可:Apache-2.0 许可,便于审计与企业集成。
- 文档与示例完善:配套文档站点和 Colab 示例,便于上手与复现。