📚 构建长期复利型知识基础设施的指南,详见 RAG 实战手册

云端智能体基础设施新纪元:E2B 与 Browserbase 深度调研与全球趋势分析

探索云端智能体基础设施新纪元,深入分析 E2B 与 Browserbase 的技术架构与全球趋势,助力 AI Agent 的未来发展。

在实际使用 Manus、Genspark、ChatGPT Agent 和 GitHub Spark 等 AI Agent 时,我常常思考这些智能体背后是如何创建和管理运行环境的——它们采用的是容器技术,还是有其他专门的基础设施?带着这个疑问,我调研了当前主流的云端 Agent 运行方案,发现 E2B 和 Browserbase 是业内较为突出的代表。两者分别在“代码沙盒”和“浏览器自动化”领域提供了创新的 Agent 基础设施,值得深入分析其技术架构和应用模式,以便理解 AI Agent 运行环境的最新发展趋势。

查看/隐藏 - E2B 和 Browserbase 思维导图

公司背景与发展历史

E2B(Enterprise to Bot) 由 Václav Mlejnský(花名 Vasek)和 Tomáš Valenta 于 2023 年创立。两位创始人是从捷克数学物理学院毕业的挚友,曾在计算机视觉等领域合作,后因 GPT-3.5 的出现萌生灵感,转向打造 AI Agent 基础设施。E2B 在创立之初即定位于构建开放源代码的 AI Agent 云端运行平台,让每个 AI Agent 都拥有自己的云端“小电脑”。公司早期获得 300 万美元起步(pre-seed)投资,由 Kaya VC 和 Sunflower Capital 领投,并有 Vercel CEO Guillermo Rauch 等知名创业者参与。不到一年内又于 2024 年宣布 1,150 万美元的种子轮融资(由 Decibel Partners 合伙人 Alessio Fanelli 领投)。最新的 A 轮融资 2,100 万美元 则在 2025 年 7 月完成,由 Insight Partners 领投,使公司总融资额达到约 3,200 万美元。E2B 总部设于旧金山,并在快速扩张团队,以满足全球日益增长的需求。

Browserbase 则是一家总部位于旧金山的创业公司,由 Paul Klein IV2024 年初创立。Klein 曾是 Twilio 工程师,后创业直播软件并成功出售,对大规模浏览器自动化有深刻经验。Browserbase 专注于提供云端无头浏览器基础设施,帮助开发者和 AI Agent 自动化执行复杂的网页任务。公司在 2024 年 6 月推出开放注册平台并宣布获得 650 万美元种子融资,由 Kleiner Perkins 领投。仅 9 个月后,Browserbase 于 2024 年 11 月完成 2,100 万美元 A 轮(由 CRV 和 Kleiner Perkins 共同领投,Okta 等参投)。2025 年 6 月,公司再获 4,000 万美元 B 轮融资,领投方为 Notable Capital,投后估值达到 3 亿美元,比 A 轮估值翻了近四倍。截至 2025 年中,Browserbase 成立仅约 16 个月,团队规模已达 30 人,拥有超过 1,000 家付费客户。下表列出两家公司关键发展节点:

两家公司的融资时间线
两家公司的融资时间线

核心产品介绍

E2B 的核心产品是一个为 AI Agents 提供云端沙盒环境的平台。这一平台以开放架构为基础,允许每个 AI Agent 即时获取一个隔离、安全的小型虚拟计算机,内置真实世界的开发工具和操作系统环境。通过这些沙盒,Agent 可以安全地执行代码、访问文件系统、调用终端指令,甚至联网等,从而完成复杂的多步骤任务。E2B 强调高安全性可扩展性:沙盒采用从底层强化的隔离技术,支持在公有云或企业自有基础设施上弹性启停数以万计的实例。开发者可以通过 E2B 提供的 JavaScript/TypeScriptPython SDK 调用 API 来启动和控制沙盒。E2B 的方案让企业可以“赋予每个 AI Agent 一台自己的云电脑”,典型功能和场景包括:

  • 代码执行与分析:让 AI Agent 拥有一个代码解释器环境,可运行任意 Python、JS 等代码,用于数据分析、报表生成等(如 Perplexity 利用 E2B 在 1 周内上线了代码分析功能)。
  • 自动化任务:Agents 可以通过沙盒调用脚本执行企业内部繁琐任务(JP Morgan 利用类似 Agent 每年节省 36 万人工时),实现工作流程自动化。
  • 研究与强化学习:研究人员使用 E2B 大规模并发启动上万沙盒,评估 AI 策略,运行强化学习仿真环境等。
  • 虚拟交互环境:通过 E2B Desktop 模块提供带图形界面的云桌面,让大型语言模型(LLM)直接操作图形界面应用,实现“Computer Use”场景。

E2B 沙盒支持任意编程语言和框架,即插即用。例如,开发者可在几行代码内调用 Sandbox,对 Agent 给出的代码片段进行执行并返回结果。沙盒的启动延迟极低(接近即时开启),可长时间保持运行,并提供监控和日志工具,方便追踪 Agent 行为。E2B 正积极将其打造成 Agent 领域的开放标准和接口,未来不仅支持 Linux 容器,也将扩展到 Windows VM、Chrome 无头浏览器等多种环境,并兼容 Kubernetes、AWS、Azure 等多云部署。正因功能完备且开源开放,E2B 平台已成为企业级 Agent 工作流事实标准之一。

Browserbase 的核心产品是一个可大规模运行无头浏览器的云平台。它为 AI 应用和自动化脚本提供“Web 浏览器 as a Service”,让 AI Agent 能像人一样使用浏览器与网页交互,但无需真实图形界面。Browserbase 平台的主要特点包括:

  • 大规模浏览器集群:开发者可通过 API 一次性启动数十、数百乃至数千个云端浏览器实例,用于并行处理任务。截至 2025 年,平台已运行超过5000 万次浏览器会话,仅 2025 年上半年就达 2500 万次(是 2024 全年两倍)。
  • 无头浏览器自动化:平台支持主流自动化框架如 PuppeteerPlaywrightSelenium。开发者可以用熟悉的方式编写脚本,Browserbase 在云端托管并执行这些脚本,每个脚本连接到可靠的浏览器实例。
  • 高级网页交互能力:Browserbase 提供了防弹的浏览器环境,包括高级调试会话录制回放全球代理网络以及反机器人检测机制,以确保自动化脚本在真实网页上稳健运行。这些特性解决了开发者自行搭建浏览器基础设施时遇到的痛点。
  • 复杂操作与数据提取:不仅支持传统的网页抓取(获取页面内容),还支持更复杂的操作流程——例如自动登录并点击按钮、填写表单、添加商品到购物车等完整用户行为。同时提供接口提取结构化数据、截屏等功能,方便将网页信息融入业务流程。

Browserbase 的定位是充当 AI 软件栈中的关键组件,被形容为 AI 应用的“眼睛和耳朵”,为上层的 LLM“大脑”提供与互联网交互的能力。其平台让 AI Agent 能像真人用户那样使用网页:例如,一个 Agent 可以借助 Browserbase,在航旅网站搜索航班并自动完成预订;或在企业内部网页系统中填写报表数据。由于这些自动化需求随着 AI 普及正变得非常广泛,Browserbase 还开发了“Director”产品,一款面向非开发者的零代码Web 自动化工具。Director 基于 AI 自动生成浏览器脚本,让业务人员通过简单的提示词就能构建并运行跨网站的自动化流程,从而将 Browserbase 的强大功能拓展到更广泛的企业用户和场景。

总的来说,E2B 偏重于通用的代码执行沙盒,赋予 AI Agent 计算和编程能力;Browserbase 则专注网页交互领域,让 AI Agent 获取互联网“前端操作”能力。两者都属于 Agent Infra(Agent 基础设施) 的重要组成,为下一代智能体应用提供底层支持。

商业模式与客户群体

E2B 的商业模式可以概括为“开源核心 + 云服务增值”。其核心技术开放源码,开发者可免费试用和自建,但 E2B 同时提供托管的沙盒云服务。官方云平台采用 SaaS 订阅 + 按用量计费的方式:基本的“Hobby”计划免费(赠送价值 100 美元的计算额度,无需信用卡);高级的“Pro”计划每月订阅费 $150 美元,享受更高并发和更长会话时长等扩展能力,并同样按实际沙盒用量收费。使用费用基于 CPU 秒和内存占用计量,如默认 2 核 CPU 沙盒费用 $0.000028/s,内存每 GiB 每秒 $0.0000045。大型企业客户可以选择“Ultimate”方案,由 E2B 提供定制化部署和支持,价格按需洽谈。此外,E2B 提供自部署选项,企业可按照开源项目提供的 Terraform 脚本将沙盒基础设施部署在自有云环境(支持 AWS、GCP、Azure 等)。这一开放 + 商用模式既吸引了开发者社区参与,又通过企业服务实现盈利。E2B 的主要客户包括对 AI Agent 有强烈需求的科技公司与大企业:例如 Hugging Face 和 LMArena 用 E2B 来安全地扩展 AI 实验;问答搜索创业公司 Perplexity 通过 E2B 一周内上线了面向付费用户的代码分析功能;芯片创业公司 Groq 利用 E2B 获得高速安全的代码执行环境。官方披露已有 88% 的财富 100 强企业注册试用 E2B 平台,这显示出传统大型企业也在积极探索将 Agent 引入自身流程。E2B 帮助这些企业以更低的开发成本实现 AI 自动化场景,同时保证安全合规,因此获得高度认可。

Browserbase 的商业模式是典型的云端 API 服务。开发者通过付费获得 Browserbase 平台的 API 访问权限,按实际使用的浏览器实例数量和时长付费。这种 usage-based 模式使客户初期可以小规模按需使用,随着应用扩展再逐步增加支出。据报道,2025 年 Browserbase 已实现年度经常性收入超过 300 万美元,主要来自现有团队不断扩大的使用量,而不仅仅是新客户增长。可见其客户在尝试平台后往往会加大投入,将更多业务交给 Browserbase 自动化。为吸引开发者,Browserbase 也提供一定的免费额度或试用机制,并在 2024 年开放了自助注册,使任何开发者都能方便上手平台。除了基础的按量计费,Browserbase 也非常重视企业客户需求,尤其在安全合规方面:A 轮融资公告时,公司即启动了 SOC2 Type1 审计和 HIPAA 合规,以便更好服务医疗、金融等对数据安全要求极高的行业客户。另外,Browserbase 新推出的 Director 零代码工具,预示着其商业模式可能拓展到高级订阅按席位授权等形式,对非技术用户提供友好的界面和支持。这将吸引那些没有开发团队但有自动化需求的中小企业,扩大全球客户基础。当前,Browserbase 的客户群涵盖各类规模的科技公司:从专注 AI Agent 的初创企业、B2B 软件公司、专业服务机构,到需要网页数据采集的风控/营销团队,以及 web UI 自动化测试的开发团队。已知用户包括医疗数据平台 Commure、新一代搜索公司 Perplexity、前端云平台 Vercel 等超过 1000 家公司。随着 Director 等产品降低使用门槛,Browserbase 有望进一步渗透非互联网行业的长尾市场,为更广泛的业务场景提供 AI 驱动的浏览器自动化解决方案。

综上,E2B 和 Browserbase 都采用了“以开发者为中心”的增长策略:前期提供免费/开源工具聚拢人气,证明技术价值后,再通过企业级功能和服务实现商业变现。一者围绕代码执行沙盒,一者专注浏览器自动化,各自找到了明确的客户痛点并验证了付费需求。在人工智能助力传统行业的大趋势下,他们的商业模式都具备良好的可扩张性和可持续性。

开源项目生态

两家公司都非常注重开源社区,积极推出开源项目以扩大开发者影响力,同时通过社区反馈完善自身产品。

E2B 的核心代码以 Apache 2.0 协议开源,GitHub 仓库名为 E2B e2b-dev/E2B )。该项目提供启动和控制云沙盒的 SDK,以及自托管部署指南。目前该仓库拥有约 9.4k 个星标(stars)、650+ 个派生(forks),社区活跃度较高。开发者可以自由查看、修改源码,并通过提交 PR 参与共建。除了核心 Sandbox SDK,E2B 团队还开源了 E2B Desktop 项目。E2B Desktop 是一个让 LLM 连接图形桌面的沙盒方案,支持屏幕流式传输、远程鼠标键盘控制等功能,为 Agent 提供类似人类使用电脑的能力。该仓库星标数约1.1k,体现了一定的社区关注度。E2B 的开源技术栈主要为 TypeScript/Node.js(后端沙盒管理和 SDK)和 Python(提供 Python 绑定),底层通过 Terraform 等实现云厂商无关的部署。E2B 社区还维护了 Cookbook 知识库,汇集不同 LLM 和框架结合沙盒的示例代码,方便开发者学习。整体来看,E2B 通过开源树立了技术透明和可靠形象,大量开发者每月从 npm 和 PyPI 下载其 SDK 超过百万次。社区用户也在 Discord 频道(超过数千成员)分享经验、反馈问题,使 E2B 开发迭代能够快速响应实际需求。

Browserbase 将部分重要工具以开源方式释放出来,最大程度拥抱开发者生态。首先是旗舰项目 Stagehand ——一个 AI 驱动的浏览器自动化框架。Stagehand 由 Browserbase 开发并在 2024 年底开源推出,旨在将自然语言指令转化为浏览器操作代码。它允许开发者按需选择代码AI 来实现网页操作:熟悉流程的部分用 Playwright 等代码实现,不确定的部分让 AI 模型自动生成操作步骤。Stagehand 提供了预览和缓存机制,以及内置集成 OpenAI 和 Anthropic 的“ Computer Use ”大模型,极大降低了构建可靠浏览器 Agent 的难度。该项目采用 MIT 开源许可证,目前在 GitHub 上已累积约 16.6k 个星标,超过 1k forks,显示出爆炸性的人气。除了 TypeScript 实现,官方也提供了Python 版本的 Stagehand 以满足不同语言开发者需求。另一重要开源组件是 Browserbase MCP Server 。MCP 代表“Model Context Protocol”,它是一个开放协议,用于标准化 LLM 应用与外部工具/数据源的对接。Browserbase 提供的 MCP Server 模块让 LLM 可以通过 MCP 协议调用 Browserbase 的云浏览器功能,实现截图、表单填写、数据提取等操作。该仓库也获得2.5k+ 星标,成为 Agent 开发者常用的桥接工具。此外,Browserbase 官方还发布了一些示例工程和模板,如 Open Operator 项目,演示如何结合 Next.js、React、Browserbase 和 Stagehand 快速构建 Web Agent 应用。Browserbase 的 SDK 客户端(Node.js 和 Python)同样开源,便于开发者查阅其实现和自行定制。Browserbase 开源项目多采用 TypeScript/JavaScript 编写,充分利用现代前端和云原生技术栈,其社区交流主要在 Slack 上进行。Paul Klein 等创始团队成员也活跃在开源社区,直接解答问题、征求改进意见。可以说,Browserbase 通过开源牢牢抓住了开发者的心:Stagehand 等项目已成为业内事实标准之一,有开发者评价其为浏览器自动化的“自然选择”。这种繁荣的开源生态也反哺了 Browserbase 商业产品,不断有优秀社区创意融入商业功能,增强了平台的竞争力。

注:以上数据截止至 2025 年 9 月。

E2B 和 Browserbase 对比

在深入了解 E2B 与 Browserbase 的技术架构和生态后,下面将从核心定位、主要功能、目标用户、商业模式及开源生态等维度对两者进行系统性对比。通过表格形式,帮助读者快速把握两款云端智能体基础设施的异同与各自优势。

对比维度E2B(AI 沙盒云)Browserbase(云浏览器平台)
核心定位开源的云端安全沙盒,赋予 AI Agent 代码执行与计算环境;被誉为“AI 代理的云电脑”托管的浏览器基础设施,提供高性能无头浏览器集群供 AI 使用;可视作“AI 的互联网接口”
主要功能即时沙盒:秒级启动隔离的 Linux VM/容器,内置sudo权限和丰富开发工具; ⚡ 安全执行:让 Agent 安全跑任意代码、脚本,支持文件 I/O、网络请求等; ⚡ 持续会话:沙盒可长时间保持,支持状态保存和多步骤任务; ⚡ 多云兼容:可在公有云或本地部署,自由扩展浏览器自动化:云端运行 Chrome/Firefox 等无头浏览器,兼容 Puppeteer/Playwright 脚本; ⚡ 网页交互:Agent 能模拟用户操作,如点击、填表、截屏和抓取数据; ⚡ 抗干扰:提供防检测机制、全球代理网络,确保脚本稳健运行; ⚡ 可视编排:Director 工具用自然语言生成自动化脚本,降低使用门槛
目标用户AI 应用开发者、数据科学家、创新团队;对让 LLM 执行代码、有自动化能力有需求的科技公司和研究机构;已延伸至部分财富百强传统企业首批为 AI Agent 创业公司、Web 自动化开发者服务;逐步拓展到非编程用户(运营、市场等)借助 AI 实现业务自动化;覆盖全球各行业中小企业
商业模式开源社区 + 云服务收费:核心代码免费开放;提供官方 SaaS 按订阅及用量收费;为大型企业提供定制部署和支持服务在线 API 服务:提供免费试用吸引开发者,按浏览器实例用量计费;通过高级功能(如全球区域部署、企业认证)及 No-Code 工具拓展付费点;投资机构、云厂商(如 Okta)亦为其生态合作伙伴
开源生态核心 Sandbox SDK 开源 (9k+⭐);附属桌面 GUI 沙盒开源 (1k+⭐);社区在 Discord 活跃,贡献插件与教程开源 AI 浏览器框架 Stagehand (16k+⭐);MCP 接入模块 (2.5k⭐);官方提供 Node/Python SDK 源码;Slack 社区维护者众多,联合创新频繁

从上表可见,E2B 和 Browserbase 都专注于垂直领域并积极拥抱开源社区。E2B 专注于“运行时/沙盒”环节,为 AI Agent 提供安全、隔离的代码执行环境,并通过开放接口与记忆、规划等其他模块集成。Browserbase 则深耕浏览器交互场景,通过极致优化和开源框架在云端浏览器自动化领域占据领先地位。技术生态方面,E2B 支持在 AWS、Azure 等主流云平台部署,兼容各种 LLM;Browserbase 支持 OpenAI、Anthropic 等主流模型作为 Agent driver,并为开发者提供丰富的开源工具和 SDK。商业模式上,E2B 和 Browserbase 均以开发者为中心,采用灵活的 SaaS 收费策略,主要面向欧美市场的创新公司和企业客户。两者通过持续技术迭代和社区共建,巩固了在 AI Agent 基础设施领域的领先地位。

全球市场影响力与发展趋势

在全球范围内,AI Agent 基础设施正成为人工智能领域新的热点赛道。欧美市场方面,E2B 和 Browserbase 作为先行者,已取得显著影响力:

  • 行业认可与采纳:E2B 的沙盒技术被视为 Agent 安全执行代码的事实标准。数百家企业在生产环境中使用 E2B,上至财富百强、大型云厂商,下至前沿 AI 初创都在其列。Browserbase 则使“让 AI 控制浏览器”从概念变为现实,在开发者群体中形成口碑效应。其开源项目 Stagehand 在 GitHub 上飞速蹿红至 16k+ 星标,表明全球众多开发者已将其纳入工具链。大量第三方项目开始集成 Browserbase/Stagehand,实现 AI 自动化网页的功能。这种生态级扩散 强化了两家公司的市场地位。
  • 资本和估值:两家公司在短时间内获得高额融资和高估值,显示投资界对该领域前景的看好。Browserbase 成立不到两年即达 3 亿美元估值,投资方包括 Kleiner Perkins、CRV 等顶级硅谷基金,反映出美国创投市场对 AI Agent Infra 赛道的信心。E2B 虽背景在欧洲,但同样吸引了 Insight Partners 这类国际投资者加持。充裕的资金将帮助它们加速技术研发和全球拓展,巩固在欧美的领先优势。
  • 产品演进趋势:E2B 和 Browserbase 的产品正不断升级,功能边界逐步扩张。例如,E2B 计划支持更多环境类型(Windows、浏览器等)和模块化扩展(秘密凭据管理、沙盒监控等),意图打造类似 Web 协议那样通用、开放的标准。Browserbase 则由开发者工具延伸到零代码平台,将复杂的浏览器自动化平民化,迎合“Everyone can vibe code”的时代潮流。可以预见,未来这两家的功能将越来越全面,与传统 RPA(机器人流程自动化)等领域产生融合和竞争。

值得一提的是,开源在此领域扮演了关键角色。开源是 AI 时代基础设施的核心策略。E2B 和 Browserbase 凭借开源先发,已聚拢了大量开发者共创生态。这预示着未来全球将出现开放合作的格局,各参与者在一定程度上通过标准和协议互联互通,共同做大市场蛋糕。

总结

AI Agent 基础设施在全球正呈现蓬勃发展加速演进的态势。E2B 联合创始人曾比喻:“就像 iPhone 应用需要 iOS,每个智能代理都将依赖自己的安全计算环境”。可以想见,在未来五到十年,赋予 AI Agent“身体”和“工具”的基础设施将像今日的云计算一样无处不在,成为数字经济的新型底座。欧美市场的创新动能与亚洲市场的规模实践相互作用,必将推动这一领域不断成熟。从当前看,E2B 与 Browserbase 已奠定先机,占据了技术和社区的高地。在这个“Agent 元年”开启之际,全球技术生态正围绕如何让 AI 更好地为人类工作而迅跑。可以预期,在多方力量推动下,AI Agent 基础设施将迎来快速迭代与标准化浪潮,成为下一代人工智能落地的关键加速器

参考资料

  1. E2B 联合创始人访谈 - therecursive.com
  2. E2B 融资报道(The Recursive) - therecursive.com
  3. E2B 官方融资公告(2025 年 7 月) - e2b.dev
  4. E2B 融资新闻稿(PR Newswire) - prnewswire.com
  5. E2B 官方文档 - docs.e2b.dev
  6. Browserbase 融资报道(VentureBeat) - venturebeat.com
  7. Browserbase A 轮融资(Pulse 2.0) - pulse2.com
  8. Browserbase B 轮融资报道(Upstarts Media) - upstarts.media
  9. E2B GitHub 仓库 - github.com
  10. Browserbase Stagehand GitHub - github.com
  11. Browserbase MCP Server GitHub - github.com

文章导航

评论区