全文 5,000字 | 阅读约 30 分钟
(Dia浏览器创始人访谈 AI重新定义浏览器)
Arc 浏览器百万用户,突然被团队放弃。
两周封测爆满,新浏览器 Dia 一上线就好评如潮。
创始人 Josh Miller 回忆那段转型期:“去年糟透了(last year sucked)。” 但推倒重来,是他们认为跟上 AI 变革浪潮的唯一办法。
2025 年 7 月3 日,在最新一期《Every》播客中,Arc与Dia联合创始人之一Josh Miller用三句话回顾了他们最艰难的一年:
Arc 月活曾达到百万,却被他们亲手按下暂停键; 70 名成员被告知要“把浏览器从头写一遍”; 唯一目标:打造一个“听你说话就能办事”的新界面。
这不是版本升级,而是一次操作系统级的清零重启。
他们为什么敢?
因为他们看到三件事正在发生:
AI 界面重构:
随着 LLM 爆发,“点链接”这件事本身正在过时。Dia 的设计理念,是让浏览器直接给答案,并帮你执行。
记忆 + 上下文能力突破:
在发布前 6 周,Dia 团队注意到模型能力跃迁,借此机会上线记忆引擎——浏览器第一次“记得住你是谁”。
窗口期判断:
Josh 与 Hursh 做出一个艰难决定:如果不围绕 AI 重构底层体验,只是给 Arc 打补丁,很快就会被下一代交互彻底淘汰。
所以他们不是在打磨一款“AI 增强浏览器”,而是在重构一整层“个人智能入口”。
正如 Josh 所说:你不是为了打开标签页而打开 Dia(体验地址:https://www.diabrowser.com/),而是为了与它对话、协作,甚至让它代劳。
本文将围绕这场浏览器重启事件,梳理三条底层逻辑:
Dia 两周私测爆红背后的真实指标与产品原型;
“可对话浏览器”背后的三大系统支柱:Skill系统、记忆机制与上下文联动;
对国内产品团队的实操启发清单:什么时候该打补丁,什么时候必须放弃重新开始?
(关联阅读|昨天分析的是 ElevenLabs 的 Voice-First 路径(主角:声音);今天聚焦 Dia 的 Browser-First 路径(重写浏览器交互为对话界面)。
两条路径背后,很多创业公司都围绕同一件事:让 AI 主动执行,而不只是回答。)
第一节|删掉 Arc、重做 Dia:产品重构的第一步
说实话,我觉得我们去年真的糟透了。
在访谈开始,Josh Miller 并没有回避过去一年的低谷。
彼时,Arc 已经累计了数百万月活用户,在业界看来是最有可能挑战 40 亿月活谷歌 Chrome 的浏览器之一。设计大胆,社区活跃,甚至在一些极客圈形成了文化标签。
但就在这时,他们突然按下暂停键。
他们决定不再继续完善 Arc,而是从头打造一个全新的浏览器。哪怕这意味着放弃用户,推翻已有的一切。
Josh 回忆,当时的内心挣扎非常真实。他们已经有了用户、收入、市场反馈——但团队越来越意识到:Arc 没法适应 AI 时代的变化节奏。
继续修 Arc,就像开跑车跑越野赛
“Arc 就像一辆精美的跑车,但道路现在变成了越野赛道。”
在 LLM 彻底爆发后,他们看到用户的行为正在变化:
人们不再希望找到网页,而是希望直接得到答案;
不再希望自己操作一堆窗口,而是希望有人帮我完成任务。
Josh 说:Arc 是为过去十年的交互习惯设计的,哪怕我们拼命加插件、加按钮,底层逻辑还是没有变。
这时候他们做了一个关键动作:暂停。
不是加功能,不是打补丁,而是停下来想:我们需要的,或许不是一个更好的浏览器,而是一个全新的产品,一个能和 AI 对话、协作、理解你的工作界面的起点。
从 Arc 到 Dia:一个“删档重来”的产品决策样本
Josh 用的比喻很有意思:与其盖新楼,不如换块地。
2023 年底,他们开始组建新的架构团队,核心指令是:
不再围绕“标签页 + 地址栏”设计界面;
不再追求“浏览器工具栏美学”;
而是:把浏览器当成“你和 AI 协作的界面”来设计。
他们不是在修一个旧工具,而是在构建一个新入口。
Hursh(Dia 另一位联合创始人 Hursh Agrawal)补充说:
你打开 Dia,不是为了浏览网页,而是为了让它干事。
这也解释了为什么他们要放弃 Arc 原有的框架、状态管理系统(如 Redux),甚至 UI 元件重写:旧系统不支持 AI 介入,它们是为手动操作设计的。
趋势判断:AI 不只是插件,而是重构起点
Josh 在对话中说了一句值得国内产品团队反思的话:如果你今天还在想‘怎么把 AI 加进我现有的产品’,你可能已经错过节奏了。
用户真正需要的,不是更快地切换标签页,而是能告诉浏览器‘帮我查一下、写一下、定一下’的能力。
这不是更高效的工具,而是更少操作的界面。
他们要做的,不是让 Arc 更好看,而是让 Dia 更“懂人”。
Josh 补充说,私测期间 Dia 的日活与任务完成率远超预期,说明用户确实把它当成了能协作的 AI 界面。
第二节|Dia 想做的,是你“第一位数字同事”
Dia 的可对话能力,建立在三个基础支点上:可调用技能、可持续记忆、可理解上下文。
Josh Miller 在节目中一再提到一件事:我们不是在给浏览器加 AI 功能,而是把浏览器本身,变成一个可以协作的智能层。
这句话听起来抽象,意思其实很直接:
“传统浏览器像是装网页的容器; 而 Dia,要成为你与 AI 协作的第一界面。”
打开它,不再是为了去点链接,而是:
记住你在做什么;
理解上下文和偏好;
主动帮你完成下一步。
Josh 说,这背后有三个核心转变:
转变一:从“静态标签页”到“任务协作线程”
传统浏览器的标签页像抽屉,你点一个,打开一个。
但在 Dia,每一个页面,都是一个任务节点。
你打开的不是网页,而是一个可执行的任务。
比如你想找餐厅:
过去是跳转到 Yelp(美国版大众点评); 现在是 Dia 自动推荐 3–5 家合适餐厅,还能直接帮你预订。
更关键是,他们不再叫这些页面Tab(标签页),而是叫Threads(任务链)。
每个 Thread 会自动记录:
你在做什么;
跟 AI 的所有对话;
已完成与待办的步骤。
你可以像发微信那样,继续对话、补充信息,甚至把这个任务交给 Dia 去执行。
转变二:引入记忆,让浏览器真正认得你
Josh 指出,普通浏览器是没有记忆的。
可能你开了几十个标签页,下次来根本不知道自己干到哪了。
而 Dia 引入的记忆模块,能做到:
自动保存你未完成的任务;
记得你偏好的网站、格式、写作风格;
甚至在你打开页面时提醒:你上次还没发这封邮件,要继续吗?
Josh 举了个真实例子:一位用户在 Dia 写客户邮件草稿,几天后打开浏览器,Dia 主动提示他:‘还要发这封邮件吗?’
这就像是个一直在线的数字助理,帮你保留状态,不用反复搜索或重做。
转变三:从“打开网页”到“理解意图”
在传统浏览器中,你要自己输入关键词、挑链接、跳来跳去。
Dia 的目标,是让你不用告诉它该干嘛,而是直接表达你的意图。
比如你说:‘我想订个适合朋友聚会的餐厅’,Dia 就知道该去哪查、怎么选、哪家合适,还能帮你订。
Josh 总结说:Dia 更像你手机里一个懂你、能动手的朋友。
不是点开五个网页自己筛,而是 Dia 理解你的偏好,直接给出结果。
本质上,浏览器不再是“静态网页集合”,而是理解你、记得你、能动手做事的协作界面。
Chrome 是你手里的万能工具,而 Dia 是你桌前的数字同事。
第三节|浏览器会动手了:Skill 是关键
在 Dia 的“记忆”与“对话历史”能力之上,还有一个更关键的进化方向:它能替你把事情做完,而不仅是陪你对话。
Josh 明确指出:
“语音、对话只是入口。我们真正关心的是,浏览器能不能听懂你的意图,并实际执行。”
这背后,是 Dia 内建的一套核心机制:Skill(技能引擎)——让浏览器不再只是显示页面,而是主动出手,把你说的话变成完成的任务。
什么是 Skill?
Skill,简单说,就是浏览器会做的事情。
比如你说“我想查一张飞往纽约的机票”,这在旧浏览器里意味着:
你要打开 Google;
输入关键词;
点进 Expedia 或某航空官网;
填信息、筛选结果,再手动下单。
而在 Dia 里,你只需要说一句话,浏览器会自动调出它掌握的技能,分步完成操作。
Josh 相信:每个 Skill 就像浏览器的‘一个小助手’,它知道下一步该去哪、怎么做。
这些技能不是插件,不是 AI 外挂,而是 Dia 内建的“动手能力”。
Skill 是怎么学会的?
Dia 的技能,不是开发团队提前写好的,而是靠 AI 学会怎么用网站。
Hursh 补充说:我们观察到,用户常常在做一类任务:比价、订票、下单、发邮件……于是我们训练模型,识别这些动作,把它们变成技能模板。
比如:
“查天气” → 自动提取你城市、调出天气源、格式化输出;
“订餐厅” → 识别地址、打开平台、预填选项、完成下单。
背后不是预设流程,而是“小助手”会做的事情越来越多。
Josh 的观点是:AI 搜索能给你信息,但 Skill 才能帮你把事办完。
Skill 与记忆功能如何协同?
Skill 并不是每次都从头开始,而是能基于你历史行为优化。
Josh 举例:
“比如你习惯订素食,它就会在‘点外卖’技能里自动优先推荐素食餐厅。”
这意味着:
记忆 → 提供上下文;
Skill → 具体执行操作。
两者配合,让 Dia 真正像一个懂你偏好、能替你做的数字助手。
而不是一个只能查资料的对话框。
用户不是输入命令,而是在说想法
更重要的是:你不用学命令、不用写提示词、不用关心模型。
你只需要说出想做的事,比如:
帮我定周五 7 点的车票;
找几个电商链接,准备买新的耳机;
写一封道歉邮件给昨天忘回的联系人。
Dia 会根据你说的内容,选择合适的 Skill,自主执行。
Hursh 总结说:
“浏览器的核心不再是页面,而是能力。Skill 才是我们真正用 AI 建起来的动手工具。”
第四节|架构重来一年,Dia 靠什么活下来的?
2023 年底,对 Josh 和 Hursh 来说,不是发布窗口,而是最黑暗的时刻。
Arc 浏览器已有百万用户、活跃度也还不错,在大多数创业团队看来,这时候应该冲刺融资、扩张市场。
但 Josh 选择了一条几乎没人能理解的路线。
我们要从头做一个新浏览器。不是升级,是重来。
这不是产品逻辑的问题,而是认知跨度的问题。
每天醒来,心里都发虚
Josh 在播客里坦白,那段时间的情绪波动大得惊人:
“每天醒来,心里都在发虚(a pit in my stomach)。甚至连我老婆都不知道我在干什么,只能说‘我们把原来的浏览器删掉了’——这种不安感来自于:放弃了已有数百万用户的 Arc,却要赌一个看不清的 AI 未来。”
Hursh 补充说:
“我们像是开船出海,却不准带导航图。只能靠一张脑子里的模糊地图。”
团队并不一开始就认同这个决定。
刚转向时,很多工程师都在问:“我们原来做的那么多东西,是不是白费了?”
设计师也困惑:“为什么不能把 Arc 改一改?为什么非要推掉重做?”
Josh 没有立刻回答,而是组织了一次回到原点的团队对话:
他复盘了 LLM 爆发后,原浏览器结构为什么会跟不上节奏的底层逻辑;
拿出一个“不是网页、而是任务协作入口”的新概念;
强调团队不是在做“更好的产品”,而是在做一个“能活过 AI 变革周期”的架构。
不从众,是他们唯一的战略选择
Hursh 在访谈中说,他们从一开始就知道:
“如果只是把 Arc 升级一下,加入个语音按钮,那我们最多再活两年。但如果我们从头构建一个真正以 AI 为中心的界面,也许能再撑十年。”
这段判断并非毫无根据。
他们曾创办过一家叫 Branch 的公司,22岁左右时被 Facebook 用 1500 万美元收购。Josh 和 Hursh 因此进入 Facebook 工作。Josh 还记得 Zuckerberg 在内部会议上预测'一切将在 5 年内成为视频'——当时听起来很疯狂,但后来 TikTok 证明了他的预见性。
这个经历让 Josh 明白:
我不想等别人先把 Dia 的概念做出来,然后我们再去追赶。
所以,即便 Arc 有用户、有收入、有品牌声量,他们依然选择从“认知层面清零”——
不是为了创新,而是为了在残酷的技术竞争中生存。
如何维系团队信任?
当然,不是所有人都能接受这个方向。
Josh 多次说到:那时候最重要的事情,不是写代码,而是稳住团队信心。
他做了三件事:
1、明确“为什么”比“做什么”重要:
每周内部分享,讲清楚“AI 为什么会重新定义浏览器”,不是一次,而是反复十几次,直到所有人都真正理解。
2、给不确定性定边界:
产品虽然推掉,但他们用 4 周时间迅速搭出 Dia 的最小原型,让团队看到“不是空想,而是可落地”。
3、建立“快发布、快迭代”的节奏:
一开始只开放语音问答、简单记忆,没有做太复杂。 Josh 说:重要的不是一上来功能全,而是团队能能看到希望。
这不是一场技术转型,而是一次认知突围 :
“别人说我们激进,但我觉得我们只是在做唯一能活下来的事情。”
启发清单:删档重做,值不值?看这三条就够了
Josh 那年之所以敢于推倒重来,不是因为他确定能赢,而是他看到了几个关键变化。
这组思路,也同样适合每一个被变化推着走的产品团队。
如果你也在面临产品重构的抉择,不妨从这三个方向思考:
1、用户行为变了,说明产品形态要变
Arc 浏览器用户开始用浏览器写备忘、做计划,Josh 说:不是我们教的是用户自己摸索出来的。
2、技术变化太快,补不过来了。
不是加个功能能解决,而是整个产品架构已经落后。
3、是否愿意承受短痛,换一个长期跃迁?
Josh 承认那一年“体验变差了”,但他们赌的是未来两年的变化速度。
第五节|谁抢下“任务入口”,谁重构平台
AI 浏览器的战争,刚刚打响。
Josh Miller 在播客中直截了当地说:Perplexity 做得很好,OpenAI 肯定也要做;甚至 Apple,迟早也会入局。
但我们相信,Dia 已经找到了正确的定位。
这个“定位”,不是功能多,而是:谁最先把浏览器变成“个人智能入口”,谁就可能颠覆整个平台秩序。
先说结论:Dia 已率先完成三件关键事
在这场浏览器升级竞赛中,Dia 已跑出一个可工作的原型,Josh 称之为:
“记忆 + 技能 + 执行速度,三条线我们已经串起来了。”
这意味着,用户不是打开一个工具箱,而是对着浏览器说出一句话,它能立刻知道你是谁、你想干嘛、应该怎么帮你完成。
这三条能力,分别解决三个最核心的用户痛点:
你是谁 → 记忆
你想做什么 → 意图理解
如何帮你做 → 替你行动
比起传统浏览器的“点链接 + 自己处理”,Dia 提供的是一整套“理解 + 生成 + 执行”的任务链条。
这个浏览器更像是:
你桌前的数字同事,而不是一堆页面的入口。
对比 Perplexity / ChatGPT 浏览器:Dia 的结构性差异在哪?
1、Perplexity 是搜索增强,Dia 是任务协作
Perplexity 的优势在于搜索结果结构化,但核心仍是找信息。
相比之下,Dia 不是想让你找信息,而是让信息直接转化为行动。
比如你在 Dia 说“帮我订今晚的晚餐”:
Dia 会自动调出你常用订餐偏好;
结合你与朋友的上次聚会地点;
给出 3 个建议,并可以代为下单。
这不是“找”信息,而是“办”事情。
2、ChatGPT 插件模型仍以会话为主,Dia 更重结构化交互
他们不是在浏览器里加个聊天框,而是让 AI 融入每个网页。
Dia 的每一个 Thread,不只是一个网页结果,而是一个可复用、可追踪、可调取的任务单元。这种可延续性,才是它与 ChatGPT 最大不同。
Josh:我们不做工具,我们在抢“操作层”
Josh 在节目中提到一句关键洞察:
“如果你看清楚这个变化,你会明白,我们不是做产品,而是在做操作层。”
什么意思?
传统的入口是搜索框、桌面图标、App 图标; 但在 AI 时代,新的入口是“你想做的事”,而不是你要打开哪个应用。
Dia 的浏览器,就是一个“能听你说、懂你意图、自动执行”的入口级工具。
基于这些观察,可以得出一个判断:
过去十年是内容分发平台(短视频 / 社交)的时代; 接下来十年,是执行入口平台的争夺。
谁能率先落地一个真正可用、值得依赖的 AI 伙伴,谁就有可能重塑竞争格局。
所以,Dia 的目标不是来聊天的,而是来干活的。
结语|不是浏览器进化,而是入口换了
Josh Miller 说得很明白:
Dia 不是来替代 Arc 的,而是来替代浏览器这种产品形态的。
过去三十年,我们习惯打开浏览器、输入关键词、点开页面,再自己去执行。
但 AI 时代更高效的方式是:说一句话,直接把事办了。
这意味着,浏览器的定义已经被改写—— 不是网页容器,而是你进入数字世界的大门。
谁先占据这个入口,谁就定义下一代平台秩序。
本文由AI深度研究院出品,内容翻译整理自Browser Company联合创始人Josh Miller和Hursh Agrawal在Every播客的深度访谈。未经授权,不得转载。
星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标
参考资料:
https://www.diabrowser.com/
https://www.youtube.com/watch?v=210zavw00y4&t=78s&ab_channel=Every
https://finance.sina.com.cn/tech/roll/2025-05-27/doc-inexzaix6857490.shtml
https://every.to/podcast/transcript-7d7adc44-103b-4483-a5a2-29a713085e33
https://blog.chrismessina.me/an-update-on-dia-from-josh-miller-8e096748578c
https://www.diabrowser.com/?ref=siteinspire&utm
https://www.theverge.com/web/685232/dia-browser-ai-arc
来源:官方媒体/网络新闻
排版:Atlas
编辑:深思
主编: 图灵
热门跟贴