作者|任彩茹
编辑|乔芊
并入美团两年半,GN06(光年之外应团队并入美团后的名字)被赋予的使命始终是:在主营业务之外,找AI Native的增长点。今年3月,他们把这件事落到了一个具体的产品上——AI浏览器「Tabbit」正式进入公测。
为什么是浏览器?大公司在AI领域争展锋芒,行业如今的热词是“虾”、“Agent”、“Token”,浏览器一定不是那个看起来“最性感”的形态,也很难与美团的核心业务紧密相融。
GN06负责人刘炯认为,AI应用的做法可以有100种,而他想做的事情,是让浏览器帮技术“小白”把活干了,解放大家的时间。
“大量的学生、知识工作者、自媒体,每天大部分时间都在电脑上,电脑上的时间大部分又在浏览器里。”刘炯说,“如果AI能在这里真正帮上忙,想象力是巨大的。”
目前,Tabbit的最新公测版本号是“0.25”,还没到“1.0版”。但它的用户留存数据已保持在行业“优良线”以上,让团队印象深刻的反馈不断涌来——有做跨境电商的人,用它写了8个自动化“妙招”,覆盖整条经营链路;有清华的学生,用它同时大批量整理论文;还有一位盲人律师,用它的无障碍功能和Agent能力处理日常工作,并在自己的圈子里主动推荐。
在刘炯看来,团队做Tabbit的目标很简单:理解用户的痛点,贴着场景做产品。只要能帮用户每天省下哪怕半个小时的无聊工作时间,让他们能早点下班,或者有精力去探索自己真正感兴趣的内容,这款浏览器的价值就成立了。
Tabbit浏览器
36氪与美团GN06负责人刘炯的对话如下: 浏览器,是离“干活”最近的地方
36氪:听说你很早就想做浏览器,为什么?
刘炯:我们见到很多人打开Chatbot输入框,他不知道要聊什么、该怎么聊,就像 MBTI 中的I人。从我的视角看,绝大部分人“看”的时间永远大于“写”的时间,无论是短视频、文章、新闻,你浏览阅读的时间大于输出的时间。
那有什么东西是用户会持续去看的?短视频肯定是一个,我们做不了,还有就是浏览网页。大量的学生、知识工作者、自媒体,每天大部分时间都在电脑上,电脑上的时间大部分又在浏览器里。他们在这里搜索信息、阅读内容、完成写作,有天然的、真实的需求。
更重要的是,把AI搬到用户已有的工作环境里,比让用户去接受一个全新的东西,难度要小得多。
36氪:你认为它会比Chatbot更贴近日常使用场景吗?
刘炯:应该说它会更懂用户需求,因为浏览器拥有你最完整的“上下文”。
我举个真实的例子:我们同事看一份公司内部材料,里面有个词叫“CPL”。如果你把这个词复制到任何一个独立的AI对话框里问“CPL是什么”,它会给你编出八种通用的商业解释。但在Tabbit里,你选中它提问,AI会结合你当前正在浏览的整个网页上下文告诉你:“根据上下文,这里应该是CPI,写错了。”
这就是浏览器的降维打击——它知道你在看什么,它懂你的语境。
36氪:Tabbit实际立项过程中,最大争论是关于什么?
刘炯:如果Chrome把AI塞进去了怎么办。
36氪:Chrome现在不就是在这样做吗?
刘炯:对,所以这个命题一直是在的。我会对这件事情更乐观一些,2023年,大家会觉得很多事情的AI化都没机会。
比如编程,当时微软的VS Code(Visual Studio Code,微软2015年发布的跨平台源代码编辑器)所有程序员的标配,GitHub也是微软的,微软自己还出了Copilot,它还是OpenAI的投资方。所有人都觉得编程这件事没人干得过微软,结果是,今天有了Cursor、Codex、Claude Code等一系列新一代的产品。
办公软件、浏览器也一样。头部产品所在的公司一定会去做AI化,但它们历史包袱往往更重,AI策略也跟我们相反,他们的首要目的是把公司自己的大模型塞到应用里。比如Google的思路一定是只把Gemini塞进浏览器,OpenAI就是把ChatGPT塞进Atlas里。
我们足够开放,把模型的选择权还给用户
36氪:你的意思是,只有你们是足够开放的?
刘炯:我们的驱动力不一样,它们的思路是“我有个模型,我要做一个非常好的入口绑定用户,把模型卖出去”,我们把各公司头部模型都接进来了,用户可以自由切换。
36氪:在模型选择这件事上,你们没有任何阻力吗?
刘炯:美团有自己的模型LongCat,但公司从来没有一天说“你只能用LongCat”。其它的模型厂商也非常开放,它们很愿意在我们的产品里有更靠前的露出和资源支持。
这背后,因为Tabbit有很多自己的用户场景,就会有厂商说,能不能一起去构造一些数据、提高某些Agent场景的成功率,以及一起定向优化模型等等。
36氪:其他玩家深度绑定某个模型,有什么不好?
刘炯:今天这个行业特别卷,谁是最强的模型?答案一直在变,而且不同场景所适合的模型是不一样的。当一家公司只能使用自己的模型时,就要承担模型不是最优选择时的风险。
2023年到现在,没有一家公司的模型一直是SOTA(state-of-the-art,形容技术最先进)的,大家此起彼伏。我不觉得这个竞争局面在接下来两三年内会有大的改变。在前期,开放是很重要的。
36氪:提供多种模型选择,对用户体验的影响有多大?
刘炯:假设90%的用户都有自己喜好的单一模型,那我们的功能设计本身可能是错的。但我们可以看到数据,用户非常明确地在切换模型,从我们的模型调用情况来看,最多的一家占比也不超过30%,这已经很分散了。
我们也收到过用户反馈说,他之前不得不在OpenAI、Google Gemini和Claude各交20美元,一共60美元,只是为了在不同场景用最好的模型。如果在我们这里,即便之后收费,可能20美元就能用上全部,对他来说也是成本的节省。
36氪:做最开放的AI浏览器,效果怎么样?
刘炯:我们3月2号正式公测,吸引来一批用户,收到了很多积极反馈,并持续自发传播和增长。数据上看,整体的留存应该是工具类产品中非常好的。
让浏览器帮技术“小白”把活干了
36氪:对最大众、最普通的用户群体而言,你认为Tabbit的使用门槛是几分?
刘炯:没有门槛。迁移成本是0——你只要点导入,Chrome里的书签、浏览的网页、登录的账号在Tabbit都是无缝登入。使用体验也完全兼容Chrome,无论之前你用Chrome、Edge还是其他Chrome内核的浏览器都能一秒上手。所有模型也都是开箱即用,不用像龙虾一样的复杂配置和API-key管理。
我自己性格比较克制,网页上各种插件的悬浮球,我很讨厌,甚至有“洁癖”。这有好有坏,好处是我们的页面非常干净,坏处是很多好的功能用户没找到。所以对于一些好功能的引导,每个功能可以做什么、怎么干,这件事情我们做的显然不足。接下来我们会在运营侧做一些好的案例,去告诉用户。
36氪:比如呢,目前为止让你印象深刻的使用场景有什么?
刘炯:做跨境电商的用户反应就很快,他们很快发现Agent可以帮他们提效。有人用Tabbit写了8个电商“妙招”,覆盖整条经营链路——从数据抓取、比价分析,到经营看板的解读,都能自动完成。
学生也是一个很有意思的群体。有清华的同学,写论文需要同时阅读大量文献时,就会用Tabbit的AI能力同时总结所有内容,跟本地文件做互动,梳理整理,大幅提高效率。
我们公司的HR,也写了一个“妙招”去招聘网站按条件自动翻简历,写好后直接分享给其他HR同事,大家一键就能用,同样省了大量时间。
还有一个让我们特别意外的用户,是一位盲人律师。以前他要在网页上填表、购物是非常困难的,但通过Tabbit的Agent能力,他可以用语音下达指令,AI能帮他读屏、比价,甚至帮他理解海外电影的剧情。他还安利给了其他盲人朋友,大家也在尝试用它给盲校学生备课或是做一些创业项目。
36氪:如果接下来Tabbit能出圈,你觉得可能会因为什么?
刘炯:我们希望通过各种有价值的好玩的“妙招”出圈。“妙招”可以在不同人群里打出不同可能性——同一个人群,可能有一些特殊的“妙招包”在,只要把这个包打开,你就发现你的日常工作都简化了。
36氪:也会有一些你们意想不到的用法。
刘炯:对。我们做的是很实用的能力,但同时有很多好玩的人会“整活儿”。事实上,浏览器本就非常开放。除了核心框架,90%的区域都是网页,你想做什么都可以。
比如我们开放了“脚本”能力后,有用户嫌网页太素,用AI生成脚本把聊天气泡全换成了粉色;有用户让网页上跑出一只小狗,打字时狗就跑,停下时狗就坐着;还有人做了一键给网页加夜间模式、自动生成长文章目录的脚本。
我们现在提供了一个能让用户“玩出花”的底座,把创造力交还给大家。
Tabbit页面
把产品做极致,从大市场中分蛋糕
36氪:如果巨头砸巨资真的把Chatbot入口砸成了AI时代用户最习以为常的入口,你们做浏览器还有意义吗?
刘炯:有。对很多用户来说,不见得在很多场景下都只用一个产品。浏览器的市场足够大,Chrome的用户大概40亿,我们只要拿下它的1%,就有4000万,千分之一也有400万。
我觉得我们跟那些入口级的Chatbot是两种事情的定义。它们可能是一个能干很多事情的通用入口,美团也在做,比如“小美”就是通用生活入口。我们团队更多是在做一个面向知识工作者、学生、白领的工作站,一个工具。
36氪:现在海外的竞争格局对你们有参考意义吗,比如Chrome面临的这些AI浏览器“新秀”的竞争是什么样的?
刘炯:海外有几个头部,咱们可以分别来看。一个是OpenAI做的Atlas,但OpenAI的战线拉太长了,做了Sora 2等一堆东西,我不觉得全方位开战能取得全面胜利。所以收缩是一件好事,我们在关注Atlas,它一直在升级迭代,我觉得它一定在最核心的那个梯队里。Dia凭借其优秀的UI设计和Arc的积累,有一批用户基础。Comet也有比较好的Agent能力。行业还在竞争早期。
然后Chrome从去年年底开始,我们所观测到的它的迭代速度是越来越快的。包括对Gemini的集成,以及之前“万年没有”的垂直标签栏,它都在快速开发。
36氪:垂直侧边栏和顶边栏的根本区别是什么?
刘炯:如果你开一堆标签,顶边栏就全是小点、小图标,你不知道每个页面是什么。垂直侧边栏的最大好处是,除了图标外还有标题,我一看就知道是哪个页面。它很影响用户体验,很多用户非常非常喜欢它。
36氪:所以把边栏从顶部挪到侧面,技术上是很难的事情吗?
刘炯:很难。其实在整个行业里面,用C ++开发出原生垂直侧边栏的浏览器非常少。
我简单科普一下这个事情吧。行业里做所谓的浏览器,大致有三种路线。最简单的一种,是把整个浏览器产品直接做成一个网页应用,网页套网页,开发特别快,可能5个人做两个月就能做出来。但网页套网页,打开之后电脑就卡死了,我之前试过的很多AI浏览器,打开一小时我的电脑就没电了,卡顿和性能是最核心的问题。
第二条路线,以Dia、Arc、Atlas为代表。它们的做法是基于CEF(Chromium Embedded Framework)——同样是从Chromium中抽离出来的嵌入层,但与Electron不同,CEF可以使用系统原生界面,这样性能更好更流畅。他们在macOS上选择用SwiftUI框架来提供好的交互体验。但代价也因此而来:这套原生UI与操作系统深度绑定,无法直接移植到Windows平台上。
我们最终选了一条最难的路,基于chromium整体架构用C++写一整套的东西。它一开始会慢一些,但回报好。早期我们做调研的时候,就看了这些路线和对应的未来可能的问题。很多功能大家看起来觉得不难,但技术策略、交互方面真的要花很多心思。
36氪:Tabbit目前能很好地兼容Windows吗?
刘炯:我们从第一天起就决定要做Windows,因为所有国家Windows用户都远多于Mac用户。用户也给了我们很好的反馈,Tabbit公测到现在,Windows用户量已经远大于Mac用户。
行业的未来还很模糊,离“情绪性判断”远一些
36氪:目前为止,你相信这款产品的大方向一定是正确的吗?
刘炯:我的理解是,作为一个AI应用团队,去理解用户的上下文在哪、用户的场景在哪,贴着这个场景去做,这是本质。至于它最终是不是浏览器,我是开放的。
我们叫浏览器是因为用户理解成本很低,而且确实是一个非常明确的场景,白领每天要花5-8个小时时间用浏览器。当然,我知道行业里有很多声音。
36氪:比如你听到过什么样的声音?
刘炯:有人觉得浏览器是错的,也有同行之前做过、又放弃的,有很多类似声音。如果我们把
AI改变世界的目标比作高考,那现在大家还在幼儿园,它也就才发展两三年,很多所谓的判断都太早了,我也不太关心。
36氪:还有其他更底层的质疑吗?
刘炯:底层的,就叙事不如“龙虾”酷呗。但这种叙事层面的东西,我又不融资,为什么要关心?我自己不喜欢跟人争辩,我很喜欢看用户反馈,跟那些真实的、对产品本身有反馈的人交流。
36氪:大家会讲很多故事,比如以后网页会变成Agent去浏览了。
刘炯:我相信Agent可能会接管很多东西,但我作为一个人,我有求知欲和探索欲。我自己会打开Dribbble看看那些设计师的作品,在B站看视频,看微信公众号的文章,获取很多信息,自己思考、写作。人是有消费内容和生成内容的诉求,我不觉得浏览器会消失。而AI能让浏览和执行这件事变得更好。
同样,我们做Tabbit的目标也很简单:理解用户的痛点,贴着场景做产品。只要能帮大家每天省下哪怕半个小时的无聊工作时间,让他们能早点下班,或者有精力去探索自己真正感兴趣的内容,这款浏览器的价值就成立了。
热门跟贴