三端通用神技！月省400元，效率翻倍轻松做|agent|browser|三端|浏览器|满血版模型|知名企业|调用|谷歌

你的 Agent 是瞎子。

这话没错。绝大多数人的 AI Agent 只能靠训练数据回答。你问"恒瑞医药今天什么政策"，它要么编，要么说不知道。

解决的办法看起来很简单——接个搜索 API。

但问题在于：一台机器翻译 API 关停后，我再也不同意外包翻译——你永远不知道第二天早上哪家涨价了，哪家跑了。

今天聊聊另一种思路：

不用任何搜索 API，让 Agent 自己用浏览器查。

成本为零，结果完整，不受任何第三方牵制。

先看看市面上的方案有多贵

网上搜 Agent 搜索方案，跳出来的全是"接 Perplexity API"、"接 Brave Search"、"接 Google 搜索 API"。

打开官方文档一看，价格都不含糊。

方案

免费额度

超出后价格

是不是真免费

Perplexity

$1/百万token(基础版)

Brave Search

~1000次/月

$5/千次查询

⚠️ 勉强

Grok

$10/千次工具调用

Kimi

¥0.6/百万token

算一笔真实的账：

一个普通用户的月度搜索成本：

• 搜一次「恒瑞医药最新政策」，翻 10 页 = 几块钱

• 调研一个竞品 = 十几块

• 每天查几次 = 一个月下来好几百

这还没算大模型总结那些搜索结果的 token 费。

你要是做 Agent 工具的开发者，这成本乘以用户数直接起飞。

换个思路：Agent 自己打开浏览器搜

思路很简单——

人类怎么搜索的？打开浏览器，输入关键词，点开链接，看内容。

Agent 完全可以做同样的事。

用浏览器自动化（OpenCLI 的 browser 功能、Playwright、Puppeteer 都行），模拟人工操作：

# 模拟人类搜索流程：
1. 打开 Bing（或 Google、百度）

2. 在搜索框输入关键词

3. 点击搜索结果

4. 提取页面内容

5. 翻页继续

6. 自动保存到本地

全程不需要调用任何搜索 API。

浏览器能看到什么，Agent 就能拿到什么。API 返回什么字段不受你控制，但你自己抓——整个页面都是你的。

而且还有一个巨大的隐藏好处：

抓下来的页面自带文字，但大部分都不是核心信息。

本地先过滤一遍，只把关键信息（大概每页 1000 字）喂给大模型。

原本 1 万 token 的网页，到你手里只剩 1/10。

Token 消耗直接砍掉 90%。

怎么封装到 Hermes / OpenClaw / Claude 里

上面说的是原理，实操就几步。

用 OpenCLI 的 browser 命令，写一个简单的搜索脚本：

#!/bin/bash
# bing-search.sh — 浏览器自动化搜索，不需要任何 API Key

KEYWORD="$1"

PAGES="${2:-5}"

DIR="bing_result/$(date +%Y-%m-%d)"

mkdir -p "$DIR"

for ((i=1; i<=PAGES; i++)); do

opencli browser go "https://www.bing.com/search?q=$KEYWORD&first=$(( (i-1)*10 ))"

opencli browser extract-text > "$DIR/page_$i.txt"

sleep 2

done

echo "✅ 搜索完成，结果保存在 $DIR"

这只是一个示意，实际用的时候可以加上链接提取、去重、过滤脏数据。核心就两条：opencli browser go模拟浏览，extract-text提取内容。

脚本写好后，封装成 Hermes Skill 只需要两步：

# 1. 创建目录
mkdir -p ~/.hermes/skills/research/bing-search/

# 2. 把脚本放进目录

cp bing-search.sh ~/.hermes/skills/research/bing-search/

# 3. 写 SKILL.md

cat > ~/.hermes/skills/research/bing-search/SKILL.md << 'EOF'

---

name: bing-search

description: 用浏览器自动化搜索，无需 API Key，支持多页

---

在 /skills/research/bing-search/ 下有一个 bing-search.sh 脚本。

告诉用户你可以搜索任何关键词，指定翻多少页，然后汇总结果。

EOF