昨天,美团光年之外团队终于悄悄的发布了他们首个AI浏览器。
也就是,Tabbit。
坦诚的讲,这个AI浏览器,我已经用了快半个月了。
现在已经取代了我之前一直在用的Perplexity家的Comet,成为了我如今的默认浏览器。
有图为证,我这篇稿子,就是在Tabbit里面写的。
换的原因特别简单,因为Tabbit的Agent能力,比Comet还要强一点,然后整个产品做的非常完整,很多小细节做的非常好,而且,还免费。
我不知道大家有多少人用过AI浏览器,但是我知道大家肯定会有一个疑问。
就是在OpenClaw如此火爆的背景下,我为啥还要用一个AI浏览器呢?小龙虾不就可以直接打开浏览器去做一下Agent任务吗?我再装一个AI浏览器,那不是多此一举吗。
那其实可以换一个问题,就是你会因为有了小龙虾,而不再使用浏览器了吗。
答案必然是,不可能。
小龙虾也好,Manus也好,Claude Code也好,这些东西本质上是你下发一个指令,然后AI替你去干活和跑腿。
你说"爬一下这篇关于XX的文章,然后帮我存一个md文件",它自己打开浏览器,噼里啪啦一顿操作,最后给你吐一个结果回来,告诉你辛苦了老板,小卡已经全部帮你搞完了。
不知道大家,至少我,现在绝大部分时候我在打开浏览器,是在各种浏览,就跟你玩游戏一样,你的目标是在不断被牵着走的。
看着看着这个页面,突然想到另一个问题,读到一篇文章的某段话,突然想深挖一下背后的概念,逛着逛着视频网站,突然想把这个文本爬下来深度学哦。
这些念头,是你在浏览过程中实时冒出来的。
你没办法提前规划,因为连你自己都不知道下一秒会看到到什么。
而AI浏览器解决的,恰恰就是这件事。
一个是异步的、任务式的。
一个是实时的、场景式的。
所以跟类OpenClaw这样的Agent产品相比,两者其实不是替代关系,是互补关系。
所以对我来说,我主流用的AI目前有三种场景:
AI Chat,比如ChatGPT、Claude、豆包等等,主要用来做各种各样的日常任务,比如搜索、提问、对话、做研究等等,它的成本也是最低的。
AI浏览器,比如Tabbit、Comet等等,用来帮我处理在日常消费内容时,即时产生的、场景式的没那么复杂的一些AI和Agent任务。
AI Agent,比如OpenClaw、Claude code、Codex等等,成本巨大,这些主要帮我处理一些高难的、涉及到开发和skills流程化场景的复杂任务。
而且还有一个很多人没注意到的点,就是你自己的浏览器里,存着你的Cookie。
这句话听起来很技术,但意思其实特别简单,意思就是,你的浏览器记得你是谁。
你登录过的所有网站,微博、淘宝、飞书、知乎、各种后台系统,浏览器全都记得,所以你登录一次以后,你下次就不需要登录了,浏览器都记得你。
所以AI浏览器在帮你做事的时候,它可以直接以你的身份去操作这些页面,跟你自己亲手点没有区别。
这件事其他的Agent当然也能干,但是很麻烦,你得搞各种各样的接入,折腾半天。
而AI浏览器,因为本身就是你的浏览器,天然就有这些权限,不需要任何额外的配置。
这个点就非常香,也是跟所有的云端Agent有鲜明区别的一点。
用了很大的篇幅,给大家说了一下我对AI浏览器这个品种的认知和观点,以及跟类OpenClaw产品的一些区别。
接下来,就说回Tabbit本身,我非常推荐大家下载一下然后去试一试。
先附一下下载链接:
https://www.tabbit-ai.com/
当然,也有国际版,模型不一样,你懂的,链接如下:
https://www.tabbitbrowser.com
兼容性上没啥可说的,Windows和Mac都支持。
因为也是用的Chrome内核,在你打开的那一刻,就可以无痛的把你的Chrome和edge的浏览器数据,比如书签、历史、密码等等迁移过来。
而且所有的Chrome插件,也都能适配。
一进首页,就是一个对话框。
可以当搜索用,也可以当Agent用,默认是搜索。
如果你想用Agent,需要操控任务的情况下,记得点击那个设置,把智能代理给点上。
这样,就是切换到Agent模式,他就能自己去执行任务了。
模型这块,因为是国产的,所以合规需求,也只能用国内模型,基本目前所有过程的顶级模型都接入了,而且比较屌的是,都免费用。
国际版的模型是国外御三家的模型,目前也都是免费用。
这块就不用我多说什么了吧,懂得都懂。
当我们随便进入到一个网页以后。也可以通过点击右上角的chat或者使用快捷键 macos 上是 cmd+],windows 上 control+]召唤出来。
然后在对话框里,你不止可以用当前页面作为你的上下文。
还可以做多源引用。
比如你可以把当前所有已经打开的标签页作为上下文,也可以用单独的某个打开的标签页,还可以加入你的某个收藏夹,还能上传自己的本地文件。
真的,可以添加一堆。
他们也做了自带的截图功能,这个截图功能,我自己体验下来,超级喜欢用,我录个是视频,大家看一下就懂了。
传统的截图,就是拖拽进行区域截图,而Tabbit在截图这个功能上,又雕了个花,可以直接识别页面上的html代码块,然后自动吸附,直接完成对页面模块的点选截图,这个体验非常丝滑,大家自己下载下来去试试就知道了。
然后,自然就是最重要的Agent部分了。
我用一个对我们这种媒体来说,非常刚需的例子来给大家演示一下。
采集我公众号后台的数据,然后自动填到飞书的多维表格里,进行数据分析。
至于为什么要拿这个来做展示,是因为飞书多维表格的操作对于这种视觉类的Agent来说还是比较复杂的。
它不像Excel那样,点一下单元格就能输入。
指令很简单:帮我把这个页面最近5篇文章的数据:标题、发布日期、阅读量、点赞量、分享人数、推荐人数、留言条数 收集一下,然后填入到@未命名多维表格 - 飞书云文档,每次添加就点击添加记录进行添加。
然后开始执行后,他会先把需要用到的标签页整理到同一个标签组。
这样整理为标签组之后,他不会影响你的其他操作。
直接把他挂在那,干自己的事情就行。
他先是在公众号后台,把数据一条一条地扒下来。
之后就切到飞书多维表格,自己分析了一下页面结构。
搞清楚每个字段在哪、怎么填。
接下来就是最考验能力的部分了,填表。
它自己知道勾选了提交后继续添加记录的复选框后填写更方便。
说实话这个操作本身不稀奇,但我之前用AI浏览器跑类似任务的时候,经常在这种细节上翻车要么漏填字段,要么搞不清楚提交按钮在哪。
Tabbit这次跑下来没出岔子,流程是顺的。
还有一个特别实际的case,也是我们公司内部遇到的真实需求。
我们公司一直在招人,每来一个新同事,最头疼的事就是找房子。
你们懂的,北京租房这事,光看中介平台根本不够
很多靠谱的房源反而藏在小红书里。
那种转租的、直租的,没有中介费,房东人也好说话。
但问题是,小红书上的信息太散了。
你得一条一条刷,看到合适的还得手动记下来,记联系方式、记价格、记位置,效率极低。
而这个事,也挺适合直接用AI浏览器来干。
输入的指令是:帮我去小红书找5个望京附近转租、直租的房子,把链接放入文档,如果帖子有关于房子的信息,例如:位置、价格、合租室友状况等都给我整理写入飞书文档正文中 。
然后就看着它自己开始刷帖子、扒信息。
因为是视觉类的,所以几乎不会被小红书ban,它找到合适的房源给我就添加到飞书文档中去了。
最后直接给我吐出来一张清清楚楚的房源汇总结果。
还有一些锦上添花的小功能,我也顺便说一下。
执行完上面那套操作之后,Tabbit还可以将其操作过程沉淀为智能代理妙招。
智能代理妙招,就是它们设计的一套类似脚本的东西。
你把刚才自动化操作的流程,点击哪里、数据填到哪里、循环怎么做,全部记录下来,后续直接调用就行。
点击这个小灯泡之后,会让你输入妙招名字。
然后就创建成功了。
创建好的妙招,点击右上角那个灯泡就可以查看。
使用也很简单直接输入 / 就可以调用。
如果你把操作流程固化下来,就变成了一个可复用的技能,跟skills挺像,但是目前确实没有skills那么复杂,也还没有兼容skills的生态,毕竟两个类型的能力确实还是不太一样。
然后就是Tabbit的妙招功能,还有另外两种形式。
提示词妙招、脚本妙招。
提示词妙招可以理解为就是把你常用的提示词存起来进行一个封装。
后续也是直接可以通过 / 进行召唤。
脚本妙招不太一样,更适配AI浏览器更有意思一点。
它本质上是一段可以修改网页的代码。
这个很屌的,你可以让他帮你生成一个脚本,实现一些自动化的功能,比如屏蔽广告、修改网页样式之类的。
我试了一个场景,就是刷推特的时候屏蔽广告。
比如刷推刷着刷着突然蹦出来一个广告,特别烦。
现在我让Tabbit生成了一个去广告的脚本。
执行生成的代码后,后续浏览就不会再有广告了,这是真的爽,
而且生成的脚本也是可以保存成妙招,后续直接调用。
所以,某些搜索引擎上的广告,还有某些网站上的广告,你都可以使用AI浏览器,直接去除。非常的爽。你懂的。
还有一些比较雕花的功能,比如横竖标签页、比如书签自动分组、标签页自动分组等等,我就不细说了,大家可以自己去体验一下。
最后,我想再说一个在我们公司发生的真实案例。
就是上周五的时候,我们公司现在将近三十来号人,还在疯狂扩张,然后最近正好赶上春招季,我们非常缺人,HR就想着参加一下北京各大高校的春招。
结果她一注册才发现,要参加春招,得在每个高校的官网上填写企业资料。
十几所高校,每一所的网页都不一样,但要填的内容大同小异:公司名称、统一信用代码、法人信息、企业简介、招聘岗位、联系方式……就是那些你抄一遍就想吐但又不得不抄的东西。
我们的HR当时快疯了,填一所学校大概要二十分钟到半小时,十几所学校加起来,少说也得大半天,而且还容易填错,因为每个网站的字段名称和格式要求都不一样。
她来问我有没有什么办法。
说实话,如果是之前,我可能会说"你去装个小龙虾试试"。但转念一想,不行,因为我们HR毕竟不是技术,让她去装OpenClaw、搞API Key、写Prompt、再装Computer Use啥的,太麻烦了,我听着都烦,也太劝退了。
那用Claude Code呢,也不太现实,毕竟是命令行的东西,没有可视化界面,你看不到AI在干什么,心里发慌。
然后我突然想到了AI浏览器,想到了,Tabbit。
这玩意,AI浏览器干,实在太合适了。
我让她直接下了一个Tabbit,打开那十几所高校的报名页面,再丢给它一个我们的企业资料文件。
然后,Tabbit就开始一个一个页面地填。
它能看到每个页面上的表单长什么样,每个字段叫什么名字,需要什么格式,它自己会去匹配、去填写、去提交。
我们的HR就坐在那,看着AI一个页面一个页面地干活,偶尔有个别的地方需要手动点一下,其余全是自动的。
十几所高校,不到一个小时,全部搞定。
几乎没有学习成本,还免费。
我当时就觉得,这尼玛才是AI浏览器的真正的杀手锏。
说实话,很多时候,我们的需求不是在办公桌前想出来的,而是在干活的过程中遇到的。
你不打开那些网页,你可能都不知道自己需要什么帮助。
这就回到了我前面说的那个核心区别:
Agent是你提前规划好任务,然后派它去执行,而AI浏览器是你在使用过程中,随时随地唤起AI来帮你处理眼前的事。
一个是计划驱动的,一个是场景驱动的。
两个都重要,但在日常生活中,场景驱动的需求其实远远多于计划驱动的需求。
你想想你每天的工作,有多少是"我提前想好要做什么然后去做的",又有多少是"干着干着突然遇到一个事需要处理的"?
大部分人的工作,其实是被任务推着走的。
所以,相对于OpenClaw这种,我反而会更加的建议大家,每一个人都可以把自己的浏览器,换成一个Agent能力强的AI浏览器。
强烈推荐一下Tabbit。
相信我,那种Agent随叫随到的感觉。
你用过,就再也回不去了。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:卡兹克、林机梦逗
>/ 投稿或爆料,请联系邮箱:wzglyay@virxact.com
热门跟贴