全文 5,000字 | 阅读约 30 分钟

 两周爆满私测,百万用户说再见——Arc 创始人押注 Dia,用 AI 再造浏览器交互
打开网易新闻 查看更多视频
两周爆满私测,百万用户说再见——Arc 创始人押注 Dia,用 AI 再造浏览器交互

(Dia浏览器创始人访谈 AI重新定义浏览器

Arc 浏览器百万用户,突然被团队放弃。

两周封测爆满,新浏览器 Dia 一上线就好评如潮。

创始人 Josh Miller 回忆那段转型期:“去年糟透了(last year sucked)。” 但推倒重来,是他们认为跟上 AI 变革浪潮的唯一办法。

2025 年 7 月3 日,在最新一期《Every》播客中,Arc与Dia联合创始人之一Josh Miller用三句话回顾了他们最艰难的一年

Arc 月活曾达到百万,却被他们亲手按下暂停键; 70 名成员被告知要“把浏览器从头写一遍”; 唯一目标:打造一个“听你说话就能办事”的新界面。

这不是版本升级,而是一次操作系统级的清零重启。

他们为什么敢?

因为他们看到三件事正在发生:

AI 界面重构:

随着 LLM 爆发,“点链接”这件事本身正在过时。Dia 的设计理念,是让浏览器直接给答案,并帮你执行。

记忆 + 上下文能力突破:

在发布前 6 周,Dia 团队注意到模型能力跃迁,借此机会上线记忆引擎——浏览器第一次“记得住你是谁”。

窗口期判断:

Josh 与 Hursh 做出一个艰难决定:如果不围绕 AI 重构底层体验,只是给 Arc 打补丁,很快就会被下一代交互彻底淘汰。

所以他们不是在打磨一款“AI 增强浏览器”,而是在重构一整层“个人智能入口”

正如 Josh 所说:你不是为了打开标签页而打开 Dia体验地址:https://www.diabrowser.com/,而是为了与它对话、协作,甚至让它代劳。

本文将围绕这场浏览器重启事件,梳理三条底层逻辑:

  1. Dia 两周私测爆红背后的真实指标与产品原型;

  2. “可对话浏览器”背后的三大系统支柱:Skill系统、记忆机制与上下文联动;

  3. 对国内产品团队的实操启发清单:什么时候该打补丁,什么时候必须放弃重新开始?


(关联阅读|昨天分析的是 ElevenLabs 的 Voice-First 路径(主角:声音);今天聚焦 Dia 的 Browser-First 路径(重写浏览器交互为对话界面)。
两条路径背后,很多创业公司都围绕同一件事:让 AI 主动执行,而不只是回答。)

第一节|删掉 Arc、重做 Dia:产品重构的第一步
说实话,我觉得我们去年真的糟透了。

在访谈开始,Josh Miller 并没有回避过去一年的低谷。

彼时,Arc 已经累计了数百万月活用户,在业界看来是最有可能挑战 40 亿月活谷歌 Chrome 的浏览器之一。设计大胆,社区活跃,甚至在一些极客圈形成了文化标签。

但就在这时,他们突然按下暂停键。

他们决定不再继续完善 Arc,而是从头打造一个全新的浏览器。哪怕这意味着放弃用户,推翻已有的一切。

Josh 回忆,当时的内心挣扎非常真实。他们已经有了用户、收入、市场反馈——但团队越来越意识到:Arc 没法适应 AI 时代的变化节奏。

继续修 Arc,就像开跑车跑越野赛

“Arc 就像一辆精美的跑车,但道路现在变成了越野赛道。”

在 LLM 彻底爆发后,他们看到用户的行为正在变化:

  • 人们不再希望找到网页,而是希望直接得到答案;

  • 不再希望自己操作一堆窗口,而是希望有人帮我完成任务。

Josh 说:Arc 是为过去十年的交互习惯设计的,哪怕我们拼命加插件、加按钮,底层逻辑还是没有变。

这时候他们做了一个关键动作:暂停。

不是加功能,不是打补丁,而是停下来想:我们需要的,或许不是一个更好的浏览器,而是一个全新的产品,一个能和 AI 对话、协作、理解你的工作界面的起点。

从 Arc 到 Dia:一个“删档重来”的产品决策样本

Josh 用的比喻很有意思:与其盖新楼,不如换块地。

2023 年底,他们开始组建新的架构团队,核心指令是:

  • 不再围绕“标签页 + 地址栏”设计界面;

  • 不再追求“浏览器工具栏美学”;

  • 而是:把浏览器当成“你和 AI 协作的界面”来设计。

他们不是在修一个旧工具,而是在构建一个新入口。

Hursh(Dia 另一位联合创始人 Hursh Agrawal)补充说:

你打开 Dia,不是为了浏览网页,而是为了让它干事。

这也解释了为什么他们要放弃 Arc 原有的框架、状态管理系统(如 Redux),甚至 UI 元件重写:旧系统不支持 AI 介入,它们是为手动操作设计的。

趋势判断:AI 不只是插件,而是重构起点

Josh 在对话中说了一句值得国内产品团队反思的话:如果你今天还在想‘怎么把 AI 加进我现有的产品’,你可能已经错过节奏了。

用户真正需要的,不是更快地切换标签页,而是能告诉浏览器‘帮我查一下、写一下、定一下’的能力。

这不是更高效的工具,而是更少操作的界面。

他们要做的,不是让 Arc 更好看,而是让 Dia 更“懂人”。

Josh 补充说,私测期间 Dia 的日活与任务完成率远超预期,说明用户确实把它当成了能协作的 AI 界面。

第二节|Dia 想做的,是你“第一位数字同事”

Dia 的可对话能力,建立在三个基础支点上:可调用技能、可持续记忆、可理解上下文。

Josh Miller 在节目中一再提到一件事:我们不是在给浏览器加 AI 功能,而是把浏览器本身,变成一个可以协作的智能层。

这句话听起来抽象,意思其实很直接:

“传统浏览器像是装网页的容器; 而 Dia,要成为你与 AI 协作的第一界面。”

打开它,不再是为了去点链接,而是:

  • 记住你在做什么;

  • 理解上下文和偏好;

  • 主动帮你完成下一步。

Josh 说,这背后有三个核心转变:

转变一:从“静态标签页”到“任务协作线程”

传统浏览器的标签页像抽屉,你点一个,打开一个。

但在 Dia,每一个页面,都是一个任务节点。

你打开的不是网页,而是一个可执行的任务。

比如你想找餐厅:

过去是跳转到 Yelp(美国版大众点评); 现在是 Dia 自动推荐 3–5 家合适餐厅,还能直接帮你预订。

更关键是,他们不再叫这些页面Tab(标签页),而是叫Threads(任务链)。

每个 Thread 会自动记录:

  • 你在做什么;

  • 跟 AI 的所有对话;

  • 已完成与待办的步骤。

你可以像发微信那样,继续对话、补充信息,甚至把这个任务交给 Dia 去执行。

转变二:引入记忆,让浏览器真正认得你

Josh 指出,普通浏览器是没有记忆的。

可能你开了几十个标签页,下次来根本不知道自己干到哪了。

而 Dia 引入的记忆模块,能做到:

  • 自动保存你未完成的任务;

  • 记得你偏好的网站、格式、写作风格;

  • 甚至在你打开页面时提醒:你上次还没发这封邮件,要继续吗?

Josh 举了个真实例子:一位用户在 Dia 写客户邮件草稿,几天后打开浏览器,Dia 主动提示他:‘还要发这封邮件吗?’

这就像是个一直在线的数字助理,帮你保留状态,不用反复搜索或重做。

转变三:从“打开网页”到“理解意图”

在传统浏览器中,你要自己输入关键词、挑链接、跳来跳去。

Dia 的目标,是让你不用告诉它该干嘛,而是直接表达你的意图。

比如你说:‘我想订个适合朋友聚会的餐厅’,Dia 就知道该去哪查、怎么选、哪家合适,还能帮你订。

Josh 总结说:Dia 更像你手机里一个懂你、能动手的朋友。

不是点开五个网页自己筛,而是 Dia 理解你的偏好,直接给出结果。

本质上,浏览器不再是“静态网页集合”,而是理解你、记得你、能动手做事的协作界面。

Chrome 是你手里的万能工具,而 Dia 是你桌前的数字同事。

第三节|浏览器会动手了:Skill 是关键

在 Dia 的“记忆”与“对话历史”能力之上,还有一个更关键的进化方向:它能替你把事情做完,而不仅是陪你对话。

Josh 明确指出:

“语音、对话只是入口。我们真正关心的是,浏览器能不能听懂你的意图,并实际执行。”

这背后,是 Dia 内建的一套核心机制:Skill(技能引擎)——让浏览器不再只是显示页面,而是主动出手,把你说的话变成完成的任务。

什么是 Skill?

Skill,简单说,就是浏览器会做的事情。

比如你说“我想查一张飞往纽约的机票”,这在旧浏览器里意味着:

  • 你要打开 Google;

  • 输入关键词;

  • 点进 Expedia 或某航空官网;

  • 填信息、筛选结果,再手动下单。

而在 Dia 里,你只需要说一句话,浏览器会自动调出它掌握的技能,分步完成操作。

Josh 相信:每个 Skill 就像浏览器的‘一个小助手’,它知道下一步该去哪、怎么做。

这些技能不是插件,不是 AI 外挂,而是 Dia 内建的“动手能力”。

Skill 是怎么学会的?

Dia 的技能,不是开发团队提前写好的,而是靠 AI 学会怎么用网站。

Hursh 补充说:我们观察到,用户常常在做一类任务:比价、订票、下单、发邮件……于是我们训练模型,识别这些动作,把它们变成技能模板。

比如:

  • “查天气” → 自动提取你城市、调出天气源、格式化输出;

  • “订餐厅” → 识别地址、打开平台、预填选项、完成下单。

背后不是预设流程,而是助手”会做的事情越来越多

Josh 的观点是:AI 搜索能给你信息,但 Skill 才能帮你把事办完。

Skill 与记忆功能如何协同?

Skill 并不是每次都从头开始,而是能基于你历史行为优化。

Josh 举例:

“比如你习惯订素食,它就会在‘点外卖’技能里自动优先推荐素食餐厅。”

这意味着:

  • 记忆 → 提供上下文;

  • Skill → 具体执行操作。

两者配合,让 Dia 真正像一个懂你偏好、能替你做的数字助手。

而不是一个只能查资料的对话框。

用户不是输入命令,而是在说想法

更重要的是:你不用学命令、不用写提示词、不用关心模型。

你只需要说出想做的事,比如:

  • 帮我定周五 7 点的车票;

  • 找几个电商链接,准备买新的耳机;

  • 写一封道歉邮件给昨天忘回的联系人。

Dia 会根据你说的内容,选择合适的 Skill,自主执行。

Hursh 总结说:

“浏览器的核心不再是页面,而是能力。Skill 才是我们真正用 AI 建起来的动手工具。”

第四节|架构重来一年,Dia 靠什么活下来的?

2023 年底,对 Josh 和 Hursh 来说,不是发布窗口,而是最黑暗的时刻。

Arc 浏览器已有百万用户、活跃度也还不错,在大多数创业团队看来,这时候应该冲刺融资、扩张市场。

但 Josh 选择了一条几乎没人能理解的路线。

我们要从头做一个新浏览器。不是升级,是重来。

这不是产品逻辑的问题,而是认知跨度的问题。

每天醒来,心里都发虚

Josh 在播客里坦白,那段时间的情绪波动大得惊人:

“每天醒来,心里都在发虚(a pit in my stomach)。甚至连我老婆都不知道我在干什么,只能说‘我们把原来的浏览器删掉了’——这种不安感来自于:放弃了已有数百万用户的 Arc,却要赌一个看不清的 AI 未来。”

Hursh 补充说:

“我们像是开船出海,却不准带导航图。只能靠一张脑子里的模糊地图。”

团队并不一开始就认同这个决定。

刚转向时,很多工程师都在问:“我们原来做的那么多东西,是不是白费了?”

设计师也困惑:“为什么不能把 Arc 改一改?为什么非要推掉重做?”

Josh 没有立刻回答,而是组织了一次回到原点的团队对话

  • 他复盘了 LLM 爆发后,原浏览器结构为什么会跟不上节奏的底层逻辑;

  • 拿出一个“不是网页、而是任务协作入口”的新概念;

  • 强调团队不是在做“更好的产品”,而是在做一个“能活过 AI 变革周期”的架构。

不从众,是他们唯一的战略选择

Hursh 在访谈中说,他们从一开始就知道:

“如果只是把 Arc 升级一下,加入个语音按钮,那我们最多再活两年。但如果我们从头构建一个真正以 AI 为中心的界面,也许能再撑十年。”

这段判断并非毫无根据。

他们曾创办过一家叫 Branch 的公司,22岁左右时被 Facebook 用 1500 万美元收购。Josh 和 Hursh 因此进入 Facebook 工作。Josh 还记得 Zuckerberg 在内部会议上预测'一切将在 5 年内成为视频'——当时听起来很疯狂,但后来 TikTok 证明了他的预见性。

这个经历让 Josh 明白:

我不想等别人先把 Dia 的概念做出来,然后我们再去追赶。

所以,即便 Arc 有用户、有收入、有品牌声量,他们依然选择从“认知层面清零”——

不是为了创新,而是为了在残酷的技术竞争中生存。

如何维系团队信任?

当然,不是所有人都能接受这个方向。

Josh 多次说到:那时候最重要的事情,不是写代码,而是稳住团队信心。

他做了三件事:

1、明确“为什么”比“做什么”重要:

每周内部分享,讲清楚“AI 为什么会重新定义浏览器”,不是一次,而是反复十几次,直到所有人都真正理解。

2、给不确定性定边界:

产品虽然推掉,但他们用 4 周时间迅速搭出 Dia 的最小原型,让团队看到“不是空想,而是可落地”。

3、建立“快发布、快迭代”的节奏:

一开始只开放语音问答、简单记忆,没有做太复杂。 Josh 说:重要的不是一上来功能全,而是团队能能看到希望。

这不是一场技术转型,而是一次认知突围 :

“别人说我们激进,但我觉得我们只是在做唯一能活下来的事情。”

启发清单:删档重做,值不值?看这三条就够了

Josh 那年之所以敢于推倒重来,不是因为他确定能赢,而是他看到了几个关键变化。

这组思路,也同样适合每一个被变化推着走的产品团队。

如果你也在面临产品重构的抉择,不妨从这三个方向思考:

1、用户行为变了,说明产品形态要变

Arc 浏览器用户开始用浏览器写备忘、做计划,Josh 说:不是我们教的是用户自己摸索出来的。

2、技术变化太快,补不过来了。

不是加个功能能解决,而是整个产品架构已经落后。

3、是否愿意承受短痛,换一个长期跃迁?

Josh 承认那一年“体验变差了”,但他们赌的是未来两年的变化速度。

第五节|谁抢下“任务入口”,谁重构平台

AI 浏览器的战争,刚刚打响。

Josh Miller 在播客中直截了当地说:Perplexity 做得很好,OpenAI 肯定也要做;甚至 Apple,迟早也会入局。

但我们相信,Dia 已经找到了正确的定位。

这个“定位”,不是功能多,而是:谁最先把浏览器变成“个人智能入口”,谁就可能颠覆整个平台秩序。

先说结论:Dia 已率先完成三件关键事

在这场浏览器升级竞赛中,Dia 已跑出一个可工作的原型,Josh 称之为:

“记忆 + 技能 + 执行速度,三条线我们已经串起来了。”

这意味着,用户不是打开一个工具箱,而是对着浏览器说出一句话,它能立刻知道你是谁、你想干嘛、应该怎么帮你完成。

这三条能力,分别解决三个最核心的用户痛点:

  • 你是谁 → 记忆

  • 你想做什么 → 意图理解

  • 如何帮你做 → 替你行动

比起传统浏览器的“点链接 + 自己处理”,Dia 提供的是一整套“理解 + 生成 + 执行”的任务链条。

这个浏览器更像是:

你桌前的数字同事,而不是一堆页面的入口。

对比 Perplexity / ChatGPT 浏览器:Dia 的结构性差异在哪?

1、Perplexity 是搜索增强,Dia 是任务协作

Perplexity 的优势在于搜索结果结构化,但核心仍是找信息。

相比之下,Dia 不是想让你找信息,而是让信息直接转化为行动。

比如你在 Dia 说“帮我订今晚的晚餐”:

  • Dia 会自动调出你常用订餐偏好;

  • 结合你与朋友的上次聚会地点;

  • 给出 3 个建议,并可以代为下单。

这不是“找”信息,而是“办”事情。

2、ChatGPT 插件模型仍以会话为主,Dia 更重结构化交互

他们不是在浏览器里加个聊天框,而是让 AI 融入每个网页。

Dia 的每一个 Thread,不只是一个网页结果,而是一个可复用、可追踪、可调取的任务单元。这种可延续性,才是它与 ChatGPT 最大不同。

Josh:我们不做工具,我们在抢“操作层”

Josh 在节目中提到一句关键洞察:

“如果你看清楚这个变化,你会明白,我们不是做产品,而是在做操作层。”

什么意思?

传统的入口是搜索框、桌面图标、App 图标; 但在 AI 时代,新的入口是“你想做的事”,而不是你要打开哪个应用。

Dia 的浏览器,就是一个“能听你说、懂你意图、自动执行”的入口级工具。

基于这些观察,可以得出一个判断:

过去十年是内容分发平台(短视频 / 社交)的时代; 接下来十年,是执行入口平台的争夺。

谁能率先落地一个真正可用、值得依赖的 AI 伙伴,谁就有可能重塑竞争格局。

所以,Dia 的目标不是来聊天的,而是来干活的。

结语|不是浏览器进化,而是入口换了

Josh Miller 说得很明白:

Dia 不是来替代 Arc 的,而是来替代浏览器这种产品形态的。

过去三十年,我们习惯打开浏览器、输入关键词、点开页面,再自己去执行。

但 AI 时代更高效的方式是:说一句话,直接把事办了。

这意味着,浏览器的定义已经被改写—— 不是网页容器,而是你进入数字世界的大门。

谁先占据这个入口,谁就定义下一代平台秩序。

本文由AI深度研究院出品,内容翻译整理自Browser Company联合创始人Josh Miller和Hursh Agrawal在Every播客的深度访谈。未经授权,不得转载。

星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料:

https://www.diabrowser.com/

https://www.youtube.com/watch?v=210zavw00y4&t=78s&ab_channel=Every

https://finance.sina.com.cn/tech/roll/2025-05-27/doc-inexzaix6857490.shtml

https://every.to/podcast/transcript-7d7adc44-103b-4483-a5a2-29a713085e33

https://blog.chrismessina.me/an-update-on-dia-from-josh-miller-8e096748578c

https://www.diabrowser.com/?ref=siteinspire&utm

https://www.theverge.com/web/685232/dia-browser-ai-arc

来源:官方媒体/网络新闻

排版:Atlas

编辑:深思

主编: 图灵