浏览器自动化工具!开源 AI 浏览器助手让你效率翻倍 前言
在 AI 自动化快速发展的当下,浏览器早已不再只是“用来点点点”的工具。越来越多的网页任务——信息抓取、表单填写、跨站流程处理——都开始依赖自动化来提升效率。而最近,一款开源的浏览器自动化工具 Nanobrowser 引起了不少技术圈的关注。
它不仅免费、开源,还能在本地浏览器中直接运行 AI 自动化流程,让网页操作真正做到“像人一样执行”。如果你正在寻找一款安全、灵活、可控的浏览器自动化工具,那么它绝对值得一试。
Nanobrowser是什么?
Nanobbrowser 是一款基于浏览器扩展运行的开源 AI 自动化工具,定位类似于 OpenAI Operator 的免费替代方案。它的核心理念是:让多个 AI 代理协同工作,自动完成复杂的网页任务。
它的特点非常鲜明:
核心优势
• 完全免费 :无需订阅,只需使用自己的 LLM API Key。
• 隐私安全 :所有操作在本地浏览器执行,敏感信息不会上传云端。
• 多模型支持 :兼容 OpenAI、Anthropic、Gemini、Ollama 等多家 LLM。
• 开源透明 :自动化逻辑完全公开,可审计、可扩展。
• 多代理协作 :Planner 规划、Navigator 执行、Validator 校验,流程清晰可控。
相比传统的脚本自动化(如 Selenium),Nanobrowser 更像是“AI 驱动的智能浏览器助手”,无需写代码即可完成复杂任务。
安装方式:三种模式
Nanobrowser 提供三种安装方式,适合不同用户需求。
1. Chrome Web Store(推荐)
适合普通用户,安装即用。
2. 手动安装最新版本
适合想体验最新功能的用户:
• 从 GitHub Releases 下载 zip
• 解压后,打开 Chrome 浏览器,进入
chrome://extensions/• 开启右上角 “开发者模式”,点击 “加载已解压的扩展程序”,选择解压后的
nanobrowser文件夹;• 配置 API Key 和模型即可使用
适合二次开发或想深度定制的用户。
实际使用体验安装 Node.js(v22.12.0+)和 pnpm(v9.15.1+)
git clone https://github.com/nanobrowser/nanobrowser.git
cd nanobrowser
:
pnpm install
:
pnpm build(构建结果在dist目录)
:参考手动安装步骤,选择dist文件夹(可选):
pnpm dev
安装完成后,只需打开侧栏,添加模型服务商,即可开始使用。
点击“open settings” 添加大模型
Windows 下设置 OLLAMA_ORIGINS 步骤 1:打开系统环境变量
1. 按 Win + S 搜索:
环境变量2. 点击: “编辑系统环境变量”
3. 在弹出的窗口中点击: “环境变量(N)…”
在“系统变量”区域点击 新建:
• 变量名:
OLLAMA_ORIGINS• 变量值:
chrome-extension://*点击 确定 保存。
步骤 3:重启 Ollama 服务
你可以直接重启电脑,或者手动重启 Ollama:
Windows 下设置(临时生效)
如果你只想当前 PowerShell 会话生效,可以用:
powershell:
setx OLLAMA_ORIGINS "chrome-extension://*"⚠️ 注意: setx 会写入注册表,但不会影响当前窗口,需要 重新打开 PowerShell 或重启电脑 才生效。
如何验证是否设置成功?
打开新的 PowerShell:
echo $env:OLLAMA_ORIGINSchrome-extension://*
说明设置成功。
例如输入 搜索“人工智能”,AI 会自动:
1. 分析当前网页结构
2. 识别可操作元素
3. 自动执行浏览、抓取、整理等步骤
4. 最终输出结构化结果
整个过程无需你手动点击,AI 会像一个熟练的网页操作员一样完成任务。
打开闲鱼
大模型: ollama,qwen3b:20b
给它一个指令“打开闲鱼,搜索2T硬盘,并得到结果”。
改成
打开“https://www.goofish.com/” 搜索2T硬盘,并得到结果
使用大模型: kimi
报错:你使用的模型不支持 Structured Output
Planning failed: Failed to invoke gpt-oss:20b with structured output:
Could not parse response with structured output
例如:
•
gpt-oss:20b• 某些本地模型(Ollama)
• 某些开源模型(Qwen、Llama、Mixtral 的部分版本)
这些模型 能聊天,但不能严格按 JSON / Schema 输出,导致 Planner 解析失败。
解决方案
把 Planner 模型 换成一个支持结构化输出的模型,例如:
• GPT-4 系列
• GPT-4o 系列
• Claude 3 系列
• Gemini 2 系列
• Qwen2.5(部分版本支持)
不要用本地模型当 Planner。
Nanobrowser的缺点 1.模型兼容性限制明显(最大痛点)
Planner 必须使用支持 Structured Output 的模型
• 本地模型(Ollama)大多不支持
• Kimi(Moonshot)不支持
• 大部分开源模型不支持
• 代理 API(如 gpt-oss)也不完全兼容
导致:Planner 只能用 GPT-4o / Claude / Gemini 等强模型,成本较高。
2. Structured Output 错误频发
常见报错:
• Could not parse response
• Invalid json_schema
• Unsupported keywords: $schema
这些都来自模型不兼容。
总结
Nanobrowser 作为一款开源、免费、隐私友好的 AI 浏览器自动化工具,正在重新定义网页操作方式。
开源地址:https://github.com/nanobrowser/nanobrowser
• 它更适合:
不太适合:
• 完全小白
• 企业级 RPA 场景
• 需要高稳定性的任务
• 技术用户
• 自动化爱好者
• 需要本地隐私的场景
• 想用 AI 做网页自动化的开发者
无论你是技术爱好者、数据采集人员、运营从业者,还是想提升效率的普通用户,它都能带来显著的效率提升。
如果你想体验真正的 AI 自动化浏览器,不妨试试 Nanobrowser。
热门跟贴