详细介绍
Nanobrowser 是一款开源的浏览器内 AI 网页自动化扩展,允许用户在本地浏览器中运行多智能体工作流并连接自有 LLM API。它作为 OpenAI Operator 的免费替代方案,强调隐私与可配置性,使用户能用熟悉的浏览器界面自动化网页任务。
主要特性
- 多智能体系统:不同角色的 agent 协作完成复杂网页工作流。
- 多模型支持:支持 OpenAI、Anthropic、Gemini、Ollama 等多种 LLM 提供者。
- 本地执行与隐私:核心动作在浏览器中运行,凭借自有 API key 控制费用与数据流向。
- 交互侧边栏:实时状态与对话式控制,便于观察与调试任务。
使用场景
- 新闻/舆情采集:自动抓取并汇总目标网站的要点与标题。
- 竞品与代码研究:在 GitHub 或论坛中批量搜索并提取关键信息。
- 重复性表单与数据填写:自动化繁琐的网页操作,节省人工时间。
- 自动化测试与采样:在真实浏览器环境中执行端到端场景采样。
技术特点
- 基于 Chrome 扩展框架实现,支持 Chrome/Edge 的完整特性集。
- 使用 TypeScript 构建,采用模块化多包仓库(monorepo)管理前端与 agent 系统。
- 可选本地模型(Ollama 等)以降低成本并实现完全离线推理。