打开网易新闻 查看精彩图片

如果生成能力会越来越便宜,代码会越来越像流水,功能会越来越容易被复制,甚至连 “聪明”本身都将成为一种随手可取的公共资源,那么最后还能拉开差距的,到底是什么?

很多人以为,AI 对软件行业最大的冲击,是让开发更快、成本更低、产品更多。可真正更深的一层变化是,一旦越来越多的软件都在调用相似的大模型能力,真正稀缺的就不再是“会不会做”,而是“做成什么样”、“让人如何使用”、“怎样把复杂能力组织成一种顺滑、可信、上瘾的体验”。

到了那时,决定胜负的,可能不再是后台那颗大脑本身,而是你如何把这颗大脑包装成一个用户愿意反复进入的世界。

这正是当下最值得警惕也最值得兴奋的转折点。软件行业正在从“功能竞争”滑向“界面竞争”,从“谁拥有更多工程师”滑向“谁拥有更高明的抽象能力”,从“堆人堆资源”滑向“少数人驾驭智能体高速创造”。

设计师开始写代码,产品经理开始直接调用工作流,原本泾渭分明的分工被迅速打散。一个小团队,甚至两个人加上一群智能体,就可能在极短时间内做出过去需要整套组织架构才能完成的原型、产品和服务。软件的制造方式,已经在静悄悄地变种。

更重要的是,这场变化并没有首先以某种惊天动地的新界面降临。你没有看到一个像鼠标、触屏那样一眼就能定义时代的新发明。

真正的断裂,先发生在更深处。它发生在工作流里,发生在角色边界里,发生在产品从概念走向上线的速度里,也发生在“谁有资格定义产品”这件事上。过去,设计师负责画图,工程师负责实现,产品经理负责协调。

现在,这几条链路正在被压缩到同一人手里。谁更懂用户意图,谁更懂取舍,谁更懂得把能力变成体验,谁就更接近新的权力中心。

Fast Company》记者马克·威尔逊今年二月亲赴旧金山,做了一次深度调研,他背靠背走访了Anthropic、OpenAI、Cursor、Krea 等公司,试图搞清楚一件事:AI 到底把设计这件事,改成了什么样子。

他找到的答案,比大多数人预想的还有具有颠覆性

Cursor 的设计主管 Ryo Lu,一周内只和另一个人,就用 AI 重建了一个原型——对象就是估值 293 亿美元的 Cursor 本身。苹果前工业设计师 Abs Chowdhury,刚刚发布完 iPhone Pro,第二年就去新公司"氛围设计"UI,不再需要工程师帮他把概念变成现实。

另一位前苹果设计师Jason Yuan说:他在给新公司融资的时候,突然觉得自己融多了因为两个人加上AI,就能干完过去需要二十个人干的活。

这不是"AI 提升效率"的陈词滥调。这是一次权力结构的重新洗牌。

设计师正在重新拿回话语权,不是因为他们学会了什么新工具,而是因为 AI 让"从想法到代码"这条路,第一次不需要工程师的许可。代码本来是设计师和现实之间的那堵墙,现在这堵墙正在消失。

但消失的同时,另一个问题浮出水面。设计师重新拿到了枪子弹是借的。

当Krea、Cursor 这类公司的护城河变成"界面",当它们接入的模型只需要修改一行代码就能替换,当 Anthropic 和 OpenAI 同时在扩张自己的产品矩阵,把同一颗大脑塞进越来越多的入口,那个真正值钱的东西,到底在哪里?

Krea 的 Victor Perez 给出了他的赌注:不是模型本身,而是模型的"品味"。他花了整整一年和 Black Forest Labs 合作,微调出一个有独特审美偏好的 Krea 模型,为了让 AI 生成的图像不再千篇一律地像 AI 生成的。OpenAI 的 Darin Fisher 说得更哲学:当 AI 替你处理所有琐碎细节,这本身不就是一种界面的范式转移吗?

但威尔逊没有给出一个干净的答案。没有人给出。

Anthropic 设计主管在文中说了一句让人难忘的话:他采访了几十位 AI 设计师,每个人进来都说"我想做聊天之后的下一个范式",但他没有找到一个真正超越聊天框的答案。

Krea的Perez说得更直白:我们现在仍处于"获取能力的阶段",真正的界面革命,还要等 AI 速度再快一百倍。

这篇文章真正讨论的,并不只是设计行业会怎样被 AI 改写。它讨论的是,当智能本身越来越像水电煤一样流向一切,什么东西会成为新的稀缺资源。

答案很可能是界面,是抽象,是品味,是工作流,是把一团巨大而混沌的能力,整理成一个普通人也愿意进入、愿意停留、愿意信任的入口。

未来的软件世界,很可能会越来越像今天的媒体、品牌和消费品世界。你表面上在卖功能,深处其实在争夺用户的认知、注意力和依赖。

当所有软件都接上同一颗大脑,真正值钱的,也许就是那只看不见的手。它决定用户先看到什么,理解什么,忽略什么,相信什么。它决定一项能力最终是变成冷冰冰的基础设施,还是变成一个有吸引力、有黏性、有护城河的产品宇宙。

这也意味着,未来最贵的资产,未必是模型本身,而是把模型驯化为体验的人。

分享下fastcompany最新的这篇深度特写报告。

打开网易新闻 查看精彩图片

‘We just have to experiment faster’: AI’s changed design forever. Now what?

“我们只需加快实验的步伐”:AI 已经永远改变了设计行业。接下来呢?

设计师现在成了程序员——或者说最好成为程序员。你的界面要么是护城河,要么变得无关紧要。带你深入探究 AI 是如何颠覆设计行业的这场令人眼花缭乱的洗牌,由 Anthropic、OpenAI、Cursor、Krea 等公司的高级布道者们领衔的精彩大戏。

作者:马克·威尔逊(Mark Wilson)

我可能刚刚见证了近年来最伟大的界面突破。也可能没有。但我确实有这种感觉?

一切发展得太快了,很难说得准。

炙手可热的编程工具 Cursor 的设计主管 Ryo Lu 邀请我来到了他们位于旧金山、以炭灰色为主调的工作室。还没来得及和任何人打招呼,我就在这个需要脱鞋的开放式办公室门口看到了一堆鞋子。我突然有些后悔,今天没穿袜子就套上了我的新百伦乐福鞋。

Lu 说话轻声细语,穿着被创意人士奉为标配的宽松阔腿裤和纽扣衬衫。他带着我穿梭在办公桌之间,路过了一排数量堪比半个运动酒吧的系统正常运行时间监控器,以及一个摆满了小物件的架子,上面放着一张 New Jeans 的唱片和一台邦迪蓝配色的 iMac。

也许你是个普通人,甚至没听说过 Cursor。这没关系。这是一家站在 AI 编程浪潮最前沿的初创公司,如今许多人相信这股浪潮将重塑我们所认知的软件。Cursor 的目标群体是专业的开发团队,但当我们坐在他的办公桌前时,Lu 承认这种优势同时也是一种劣势。

如果你注册 Cursor 只是为了进行一些随性的“氛围编程”,你很可能会被软件中无处不在的命令行和首字母缩写词弄得晕头转向。[译注:vibecoding,指不强求理解底层逻辑,凭借直觉、自然语言和 AI 辅助来快速生成代码的编程方式。]

Lu 提出,他可以用他的新项目来化解这种张力,他称之为“宝贝 Cursor”。Lu 将宝贝 Cursor 视为公司软件(于 2023 年首发)的下一代产品。当他加载它时,我没有看到任何令人生畏的代码框。

我主要看到的只有一个提示词输入框。只需轻轻一点,设计师就能调出一个应用程序并重新排列其组件,随后它会以代码的形式吐出更新。或者,产品经理可以加载一份项目摘要,将目标转化为具体的工作流。实际上,任何人都可以调出一个智能体(Agents)团队来协调工作,而自己则可以悠闲地去喝杯抹茶。

Lu 在他的作品中快速穿梭,展示了宝贝 Cursor 如何最终展开为一个庞大的工作站——与现在的 Cursor 界面颇为相似——或者缩小成一个潜伏在你屏幕角落的助手。Lu 将 Cursor 的未来想象成一把无限的“瑞士军刀”,每个窗口都提供服务的不同侧面:一个拥有十几种不同面孔的 AI,全部接入同一个引擎,为任何受众提供最完美的界面。

“我脑子里想的,就是让 Cursor 同时成为最简单的东西和最疯狂的东西,”他说。

但宝贝 Cursor 最疯狂的部分甚至不是它的设计。而是 Lu 仅仅花了一个星期,而且只和另一个人(李·罗宾逊,Lee Robinson)一起,就做出了这个原型。再读一遍这句话:一个两人的团队,在一周内,重建了目前估值 293 亿美元的 Cursor。

对我们大多数人来说,AI 革命的意义可能仅仅局限于对话式搜索引擎、自动撰写的电子邮件以及源源不断的多媒体“赛博垃圾”,但在硅谷,它正在彻底颠覆产品开发。软件构建的方式不仅发生了改变;它还经历了指数级的加速。现在,设计师可以是程序员,也可以是产品经理,开发过程可以一步到位,直接从概念走向生产。

在我二十年的报道生涯中,我曾无数次造访旧金山。但在三年前的一次旅行中,我感觉世界发生了一些偏移。在 2023 年 ChatGPT(一种大型语言模型)席卷主流之后,我参观了 AI 革命的“原爆点”,对各大初创公司进行了 72 小时的巡礼,试图理清 AI 将如何影响设计的未来——并由此推及人们将在生活中体验这项新技术的方式。

仅仅三年前,设计师们还在极富诗意和哲学深度的讨论中抽丝剥茧地探讨这些想法:大语言模型(LLM)到底是什么?除聊天之外,你还能用一台无所不知的机器做什么?如果 AI 成为软件背后的引擎,它的触点将如何转变为我们从未想象过的形态?

随后在今年 2 月份,我以设计记者和 AI 观光客的双重身份重返此地,发现人们现在谈论的重点已经变得非常具体。我背靠背地参加了包括 OpenAI 和 Anthropic 在内的 AI 巨头会议,同时也拜访了追逐下一个风口的投资者和初创公司。在几个场合中,我甚至找回了三年前的采访对象,看看他们的观点发生了哪些改变。

下面的文章是对他们观点和我个人观察的综合。你可以把它看作是 AI 时代精神的一个缩影,以及对当设计师同时也成为软件开发者时会发生什么的一种预测。

正如创立了社交 AI 初创公司 Future Lovers 的前苹果设计师杰森·袁(Jason Yuan)告诉我的那样:“对于作者型创作者(auteur)来说,这是最好的时代。”[译注:auteur 源自法语,原指拥有极强个人风格的电影作者,这里指能够独立掌控产品全局的顶尖创作者。]

打开网易新闻 查看精彩图片

“氛围转变”的背后

相比于 2023 年旧金山那种近乎后世界末日的氛围,这座城市最近经历了一次彻底的风向转变(vibe shift)。迎接我的是我几乎认不出的街道,无数风险投资资金吸引了新一代年轻企业家在这里重新建设。公园里现在挤满了人。

二十多岁的年轻人在曾经废弃的店面外排队,购买 7 美元的牛角面包和 45 美元的套餐——对于 IPO(首次公开募股)前的人生来说,这是对钱包友好的奢侈享受。自动驾驶的 Waymo 汽车备受信任,甚至比人类驾驶的优步汽车收费还要高。

这是一座正在驾驭自动化的城市,使用新的 AI 来构建新的 AI。与此同时,每位创业者都在担心休假会让自己被时代的列车甩下。从我短短几天的所见所闻来看,这些担忧似乎是有道理的。

你在旧金山能感受到的这种全新创造活力,是由风险投资行业注入的。仅在 2025 年,风险投资就向湾区的 AI 公司投资了 1220 亿美元。庞大的风投行业本身也在快速扩张。

总部位于旧金山的投资公司 NFX 的创始合伙人詹姆斯·柯里尔(James Currier)表示,1994 年,风投公司只有 150 名普通合伙人;现在这个数字已经超过了 3.3 万。他说这是一个充满“错失恐惧症”(FOMO, Fear Of Missing Out)的市场,因此,一家在 2022 年 A 轮融资中估值为 1800 万美元的公司,现在的估值可以高达 1.4 亿美元。

当柯里尔和我在三年前初次见面时,他睁大眼睛寻找着能像优步利用智能手机改变交通那样、利用 AI 改变我们日常生活的初创公司。然而出乎意料的是,我们看到企业家们大都倾向于一个“统御一切”的应用场景:氛围编程。

“目前(投资的成功)在很大程度上是随机的,因为初创公司太多了,风投公司也太多了,而且大家都长得差不多,”他说。

在我 2023 年的拜访之后,似乎有一段时间 AI 领域并没有发生什么大事。是的,每周都有新模型问世。是的,一代更比一代强。但没有人真正证明 AI 将如何让我们以截然不同的方式生活或工作。

这种情况在 2025 年 11 月 Anthropic 发布 Claude 4.5 时发生了改变。虽然开发人员多年来一直使用 AI 工具来辅助编写代码,但这次更新是一个转折点。它更加可靠,也更容易通过提示词进行引导。你第一次可以仅仅通过与 AI 聊天,就真正编写出复杂的项目。

“即使 AI 从现在起停止进化,我们也还能看到它对世界产生另外 95% 的影响,”柯里尔坚持认为。他指的不仅是氛围编程的影响,还有潜伏在现代大语言模型中尚未被挖掘的潜力。

你可以说氛围编程就是那场革命,或者说氛围编程是带领我们走向那场革命的众多工具之一。但有一件事是肯定的?在 AI 的这个原爆点上,氛围编程已经以美国中部地区未曾见过的方式改变了工作。与早期的投资热潮不同,许多风投资金不需要用于资助庞大的开发团队;它们可以直接被用来购买越来越多的 AI 代码。

我原本以为,要释放 AI 的力量,我们需要一套全新的交互模态,就像鼠标引入了图形用户界面(GUI),或者多点触控让智能手机变得直观易用一样。但事实证明,今天的 AI 革命与按钮、旋钮或语音毫无关系。

AI 改变了工作方式,却几乎没有改变前端 UI。它赋予了我们拥有编程智能体的能力,可以一次性烹制出数百行可靠的代码,并与其他智能体协同工作,为新软件注入生命。

毫无疑问,编程一直是 AI 最成功的用例。回想起来,这很合理。机器天生就懂机器的语言。

“我认为代码最令人惊叹的地方在于,它能为你创造有用的东西。它不仅仅是反馈给你一个答案或一句话,”Anthropic 的设计主管乔尔·莱文斯坦(Joel Lewenstein)说。“它是在实实在在地进行创造。”

智能是新的材料

坐在灯光昏暗的歌舞厅里,阿布斯·乔杜里(Abs Chowdhury)把他的 iPhone Pro 放在了我旁边的桌子上。我看得出他在打量我选的颜色(橙色),这也合情合理,因为这玩意儿就是他设计的。这位前苹果设计师就在去年还站在苹果的舞台上,发布他设计的 Pro 和 Air 机型。

去年 11 月,他被一份无法拒绝的邀约挖走,随后这位工业设计师开始为他那个神秘的新 AI 初创公司 Hark(获得了 1 亿美元的资金支持)进行 UI 的“氛围设计”。他坦言,在招募团队和建立设计工作室的同时,他将 Photoshop 或 Illustrator 中的粗略设计直接转移到 AI 代码工具中,并通过代码提示词进行编辑。不再需要工程师来帮他把那些概念幻想变成现实了。

同样,另一位前苹果设计师袁感慨道,在了解到氛围编程已经变得如此强大之后,他觉得自己为新初创公司筹集的资金似乎太多了。在一家挤得连说话都听不清的餐厅里,我们就着阿尔巴利诺葡萄酒和土豆汤,听他详细讲述了他的公司 Future Lovers 是如何打造一种类似于 Pluribus 《同乐者》结合《绯闻女孩》的社交 AI 的。

自从 Claude 4.5 发布以来的五个月里,他主要依靠自己和 AI 一起构建他的第一款产品,只有一名编程顾问和几名合同工协助——尽管他后来聘请了一名全职 AI 专家。(披露:我曾短暂担任过袁上一家初创公司 New Computer 的顾问。)

“现在有一个筹集大量资金的新理由,那就是算力,”袁说。“如果你有坚定的信念,清楚地知道自己想要什么,那你为什么现在还要雇佣 20 个人来告诉你你在做什么?那纯粹是协调成本。”

乔杜里和袁是两位才华横溢、拥有傲人职业履历的设计师。他们是真正的匠人,精通设计工具,能够微调我们大多数人甚至无法察觉的细节。但他们各自都拥抱了氛围编程、氛围设计或氛围实现——不管你想怎么称呼这个奇怪的东西——这一事实确凿地证明了实践方式的演变。

没错,乔杜里后来确实聘请了专门的界面设计师。但他们对这些工作流的热情表明,一旦设计师开始像电影作者那样用 AI 展现自己的想法,就很难再回头了。正如袁所写的那样,智能是设计师进行创作的新材料。它正在成为一种媒介,就像上个时代的像素或铝一样,人们重塑它变得自然而然。

这种演变似乎必然会将权力从工程团队拉回到设计师和其他产品愿景家手中。由于设计师本质上是在学习编程,在许多情况下,专业程序员正在从这个过程中被逐渐抽象和边缘化。

这种抽象化正在为工程团队制造张力,迫使他们在保持传统专业知识的同时跨界掌握新的效率模式——这说起来容易做起来难。那一周的晚些时候,我拜访了视频游戏氛围编程初创公司 Moonlake(该公司获得了英伟达/NVIDIA 等公司 3000 万美元的融资)。

两位年轻的斯坦福(Stanford)研究生创始人告诉我,作为招聘流程的一部分,他们所有录用的工程师现在都必须在他们面前当面写代码,而具体观察他们如何使用 AI,是这份工作的重要考核标准。

“这其中的界限非常微妙。我们发现现在的程序员如果不太了解你的代码,最终往往会搞崩整个代码库,”联合创始人莎伦·李(Sharon Lee)说。“我们现在要确保一半的工程师使用(传统的)手写代码,另一半则使用大量的工具。”

毫无疑问,推向市场的速度是促使人们决定用机器而非人力进行构建的许多原因所在。甚至连那些精益求精的工匠们也拥抱了设计界“快速行动,打破陈规”(move fast and break things)的时代,这与过去 30 年来追求完美主义的理念显得格格不入。

“你不能再像过去苹果那样,打造那种让人忍不住想舔一口的精美工艺和界面了,”袁说。“你做不到,因为等你为 ChatGPT 3 做好了最完美的界面时,时代已经发展到 GPT 6 了。”

打开网易新闻 查看精彩图片

下一个伟大的界面(并不存在?)

我坐在 Anthropic 众多阳光充足的会议室之一,手里紧紧攥着一杯果味浅焙咖啡,杯子是一个半釉陶瓷马克杯。当产品设计主管乔尔·莱文斯坦用连珠炮般、极其乐观的语调谈论着他对 Claude 未来的愿景时,这种接地气的泥土气息感觉彻头彻尾地不合时宜。

三年前,设计界的大部分人还在苦苦思索,是否会有一个伟大的 AI 界面来统治一切——也就是在提示词框里跟大模型聊天之后出现的某种东西。当时硬件实验层出不穷(安息吧,Humane 和 Rabbit),而关于所有界面的未来是否会是生成式的(即 AI 在任何特定时刻为你变出完美的新按钮)争论也如火如荼。

“有一个巨大的讽刺。很显然,我招聘并面试了数十位 AI 领域的设计师,每个人进来(都说)‘我想做聊天之后的下一个范式!我有个好主意!’我见过了几十种不同的方向,但没有一个是真正超越聊天的东西,”莱文斯坦说。

他指出,即使是像 Claude Code 这样被证明非常成功的产品,表面上看仍然是聊天的延伸。“所以我不知道这里的答案是什么。我们手里并没有一个让我 100% 确信就是聊天之后新范式的原型。”

就像它的竞争对手 OpenAI 一样,Anthropic 正处于扩张期。主要的大模型提供商正在使他们的产品组合多样化,就像微软和谷歌在几十年前扩展其服务一样。Anthropic 并没有通过单一的主力门户或界面让 Claude 自身做更多事情,而是将 Claude 拆分成各种不同的子产品,这些产品给人的感觉大同小异。

“我们有一个深受财务人员喜爱的 Excel 插件。它隐约有点像我们的 Chrome 扩展程序,Chrome 扩展又隐约有点像 Claude AI,而 Claude AI 又隐约有点像 Claude Code。但它们确实都是为不同的用户量身定制的,”莱文斯坦说。

他指出,他们已经将一套共享的设计语言编入了由 AI 驱动的开发流程中。“在这个阶段,我们宁愿为四种不同的人群打造四款非常出色的产品,然后再考虑接下来怎么做,因为这样可以让我们学得更快,对吧?”

先发布,后学习:正是这种心态,让 Anthropic 在短短五天内就建立起新的 Claude Cowork 平台。但这同时也意味着,Cowork 与 Claude 自身是脱节的,而非紧密整合。这是 Anthropic 必须向其自家受众推销的又一个新玩意儿。

“事情发展得太快了,我们别无他法,只能加快实验的步伐,”莱文斯坦说。“大融合(Convergence)是很难的。因为你必须弄清楚什么是共享的部分。你必须构建那条共享路径。其他系统上还有很多人们喜欢的边缘功能。而且变化太多、太快了。”

坐着 Waymo 穿过小镇后,我来到了 OpenAI。他们的办公室位于一栋以前由优步拥有的大楼里。虽然大多数保安都驻扎在前台或门口,但 OpenAI 的安保措施甚至延伸到了人行道上。我来到一个从高楼层凸出来的封闭式门廊,在那里,我见到了或许是网络浏览器背后最伟大的在世传奇人物。

达林·费雪(Darin Fisher)随意地坐在野餐桌旁,解释了为什么他在 OpenAI 的设计方法并没有那么激进。这位曾参与开发网景(Netscape)、Chrome 和 Arc 浏览器的幕后大脑,如今在担任 OpenAI Atlas 浏览器的技术负责人。

他最紧迫的设计争论之一是什么?AI 聊天框应该放在界面的哪一边,左边还是右边?(平心而论,这个问题比乍看起来要令人困惑得多——但这仍然算不上是打破范式的工作。)

“我不是那种会问‘我们如何能改变一切?’的人,”他说。“我更多思考的是,如何从人们现有的习惯出发进行迭代?如何让它变得更好?很多最终落地的东西,其实都是围绕人们已经习惯的中心,去优化他们熟悉的工作流,这丝毫不会让我感到惊讶。”

但紧接着,费雪审视了片刻自己的想法,给出了一个非常中肯的反方观点。

“(AI)为你代劳的方方面面,让你不必再深陷各种琐碎细节之中,这本身不就是一种 UI 上的范式转移吗?” [译注:原文为“in all the weeds”,俚语,指深陷错综复杂或极其琐碎的细节中无法自拔。]

费雪说得没错。但 Anthropic 和 OpenAI——以及所有前沿大模型提供商——仍然面临着一个非常确定的风险。他们正在重新创造一套各不相同、松散连接的服务,正是这套打法让软件巨头在上个时代占据了主导地位(想想微软视窗操作系统 Windows、Teams、Outlook、OneDrive、Excel、Word 等)。诚然,这种策略挤掉了在法律和医疗等高度特定应用领域的竞争对手。但这已经不是 90 年代或 21 世纪初了。

如今的软件开发变得轻而易举。因此,成为一个拥有三十个头的平台“九头蛇”,反而让这些前沿大模型构建者容易受到初创公司的攻击。因为这些初创公司拥有更清晰的目标和施展拳脚的自由,能够构建更全面、更清晰、更周到的服务,从而可能成为 AI 的主要触点。

AI 行业从未预见的战略

几年前我第一次遇到巴塞罗那酷小孩维克多·佩雷斯(Victor Perez)时,他正在他商住两用的公寓里用 La Croix 气泡水罐堆砌高塔。他当时也在开发 Krea,这是一款类似于 AI 时代 Photoshop 的软件,它以毫不松懈的节奏将最新模型融入其中,承诺每周都会推出新功能。

如今,在获得 5 亿美元估值之后,他坐在了 Krea 位于渔人码头(Fisherman’s Wharf)的新办公室里。这是一个二楼的砖墙空间,有一间玻璃会议室,透过百年历史的拱形窗户还能看到恶魔岛(Alcatraz)的风景。

尽管有充足的自然光,佩雷斯依然将自己过去三年的生活戏称为“穴居”。Krea 既赚钱又有价值,但佩雷斯(连同他那 37 人的团队)仍在拼命工作。他看起来像是饿坏了,亟需一个三明治。

2023 年,当大多数 AI 公司都在筹集资金试图训练大型 AI 模型时,Krea 采取了不同的策略。它构建了自己的软件,然后接入了别人的 AI 模型。它打包了世界上许多顶尖的 AI 模型(如 Runway 和 Luma),提供前端体验——要知道,在当时那些模型看起来都是封闭且受到严密保护的。

“做一个 API 套壳产品(API wrapper)这个想法对我来说其实并不明显。我们是第一个这么做的,但我当时以为我们会挨告,”佩雷斯承认。“怎么可能所有这些公司花了几百万美元训练这些系统,却不尝试将这些系统植入到他们自己的产品中?我以为他们会这么做的!”

佩雷斯非但没有挨告,反而收到了许多请求,要求将某些模型在列表中排名提前以获得更多曝光。Krea 是首批证明某种架构行之有效的公司之一,如今这种架构已司空见惯:即一款软件可以作为其他 AI 模型的交互界面。

Cursor 采取了类似的方法,通过应用层来占据 AI 领域——和 Krea 一样,它运行自己的一些 AI 模型,但也接入了 Claude 和其他第三方模型。由于 AI 模型的换入换出真的只需要一行代码,因此像 Krea 和 Cursor 这样的产品,即便在更好、更新的模型层出不穷时,也具备一定的生存能力。它们的护城河就是它们的界面。

佩雷斯承认,目前在 AI 领域,没有哪种策略是万无一失的。“人们,包括我们自己,在整合 API 并在此基础上构建产品方面都非常成功,”他说。“但我感觉三年后,我们将不得不讨论这样一个问题:为什么在 2026 年这些 API 套壳被炒得火热,而在 2029 年却无人问津了。”

讽刺的是,尽管佩雷斯认为,在一个没有人能指望与谷歌或 OpenAI 竞争的时代,开发模型对小型初创公司来说是一条死胡同,但他同时也认为拥抱模型开发才是 Krea 的未来。

他主张,如果不控制模型的核心杠杆,你就无法构建用于操纵 AI 的创意工具。这是因为前沿模型在后训练(post-training)阶段被微调的目的是为了实现跨任务的广泛功能,而不是为某一种特定的视角服务——它们被打造得像流水线生产的“奇迹面包”一样,只为了取悦最广泛的普通大众。[译注:Wonder Bread 是美国一种常见的切片白面包品牌,常用来比喻平淡无奇、缺乏个性的工业化标准产品。]

因此,在 2025 年,Krea 与 Black Forest Labs(广受欢迎的 Flux 模型的创造者)合作,协助微调了一个定制的 Krea 模型,本质上赋予了系统在多种风格上的“品味”。这种文本生成图像(text-to-image)的工作流创建的图像摆脱了明显的 AI 感,让照片更具真实感,让插画更有手绘感。

这种安排听起来可能在技术层面上有些让人困惑,但这种合作关系在商业界很常见:这不过是一次联名合作!从鞋子到冰淇淋口味,公司经常与外部设计团队合作,将产品推向双方单独都无法达到的新高度。

佩雷斯将模型后训练的过程比作使用 Pinterest。你通过教导算法你的喜好来定制你在 Pinterest 上的体验。然而,定制训练前沿模型的机会在当今行业中并不真正存在。这使得每个进行媒体创作的人只能任由工程师(而不是设计师)摆布,结果我们制造出了更多低质同质化的垃圾内容。

“你无法创造出比谷歌更聪明的模型,但你可以创造出更多品味——一个更有品味的模型,”佩雷斯说。

这一观点引起了卡丽娜·阮(Karina Nguyen)的共鸣,她曾是 OpenAI 和 Anthropic 的研究员,目前正在建立自己的公司 Thoughtful。(我们在电话里取得了联系,因为她当时正在签公司第一个办公空间的租赁合同。)据她估计,世界上大约只有 200 名精通后训练方法的专家,由于他们都是工程师,他们优化模型的思路是围绕数学和工程思维展开的。

但阮设想,由同等权重的工程和设计专业知识作为支撑,Thoughtful 可以为其他公司对模型进行后训练。这能将特定的 AI 敏感度带入医疗或法律等领域,而这些敏感度在广泛优化的模型中往往会丢失。

许多 AI 体验感觉千篇一律,是因为它们接入的 AI 都是一样的。Krea 和 Thoughtful 正在考虑如何在不从头开始构建前沿模型的情况下对其进行微调——这使他们能够创造出比我们从前沿大模型公司那里得到的那些匆忙上线的功能更丰富的体验。

“每个星期都有新事物发生,他们必须做出反应。因此没有空间(去真正思考),”阮说。“你应该允许人们去想象,给他们离开去畅想的创意空间。我认为最具变革性的研究就是这样产生的,设计也是如此。”

当我问佩雷斯,为什么我们没有看到初创公司在 AI 的 UI 上进行更多实验时,他的回答包含两个层面。

首先,他指出工作流已经为许多创意人士发生了改变——这呼应了我从 OpenAI 的费雪那里听到的观点。例如,他说,设计师现在可以拍摄一张产品照片并生成该照片的更多角度,甚至生成一张海报或一部电影。这里的 UI 并不新,但工作流是全新的。

其次,他表示,可能解锁下一级别 AI 能力的新交互模态目前还无法实现,因为 AI 的速度还不足以支撑它们。

“我们仍处于获取能力的阶段,”佩雷斯说,“在完成能力阶段之后,才会进行性能优化。”

Krea 一直在追求性能优化。它是第一家实时生成风格化视频的公司,但他表示,这在很大程度上只是一个概念验证,因为人们更倾向于花时间等待以获取好得多的输出结果。给机器时间去渲染,它就能生成保真度更高的 AI 视频。但 AI 漫长的渲染时间与流畅的工具体验是不可调和的。

“你不可能用一个需要两三分钟才能生成的东西来构建界面,”佩雷斯直截了当地说。但与 Black Forest Labs 合作训练模型让他们更进了一步。不可避免地,佩雷斯设想有一天,这些 AI 运行速度将提高 100 到 1000 倍。到了那时,我们将最终看到关于全新的一套多模态混合 GUI 工具如何运作的更大胆实验。

在此之前,我们只有氛围编程。

打开网易新闻 查看精彩图片

AI 就是瞬息全宇宙

在距离 Cursor 总部几个街区外的北滩,我走上一段长长的楼梯,此时 Lu 正在畅谈他对公司更宏大的愿景。他回忆道,当他生活在中国时,所有的代码都是他自己写的。

但当他来到硅谷时,他成为了一名真正意义上的“设计师”。突然之间,接触代码与他的工作完全脱节了。他在美国早期的一个项目尤其令人备受打击,他眼睁睁地看着一个充满愿景的项目在开发过程中逐渐枯萎。

Cursor 让他完成了一个轮回,重新成为一名在本质上能够写代码的设计师。在这个新时代,设计和开发不再是割裂的步骤。每一个概念几乎都可以瞬间变成现实。这也在酝酿着人们对软件的新期望。

“我认为 Figma(一款流行的设计软件)在我只想在 2D 空间里把玩时仍然很有用。我想做我的画板,我想确切地规定我的像素看起来究竟是什么样子,”他说。“但在某个节点上,继续做这些标记就没意义了。因为你希望它在现实中跑起来,对吧?如果你……在 Cursor 里做原型……那就好像,我真的、真的很难再回到 Figma 了。”

正是这种理念驱动着他构建出一整套“瑞士军刀”般的窗口。Cursor 正在进化成一个包含无限可能性的浏览器,而不是充满按钮和工具提示(tooltips)。它是无数块白板,或是数字橡皮泥,等待着被你的下一个创作填满。

真正的挑战在于如何确保每一个窗口都能在用户当前的水平上满足他们,并带领他们去向下一个目标。但这些窗口底层的引擎呢?在 AI 时代,无论哪家公司,那个引擎可能只是少数几个共享的模型而已。

Lu 通过宝贝 Cursor 所展示的宏大愿景,实际上在很大程度上与 Anthropic 通过其不断扩展的平台和扩展程序所追求的目标是一致的——尽管他们是从完全相反的方向切入的。

开发者们正在意识到,AI 是一台具有无限人体工程学特性的机器。它并不像有些人所说的那样,通过生成式原生 UI 进行字面意义上的“变形”,但它正越来越多地挤进每一个可能的语境中。它可以成为任何特定用户所需要的任何触点。

这意味着 AI 将不会被一种新或旧的交互模态所定义——不是按钮,不是智能体,不是语音,也不是工具提示。它将是所有的模态,在所有的时刻,同时发生。它将不断长出新的能力,不断向新的需求弯折,并越来越受到作者型设计师的掌控。

但是,如果所有这些触点最终都接入相同的 AI 后端,我确实会怀疑,一开始拥有那么多不同种类的软件到底还有多长时间的意义。

“我的理论是,就像所有的软件几乎都是同一种东西。一些概念的包装,然后数据在某处漂浮,互相传递,”Lu 说。“所以大融合几乎是不可避免的。然后竞争就变成了,看谁能创造出最好的界面和最好的抽象,最简单且能规模化扩展的那些。”

你可以几乎想象这样一个未来,有史以来第一次,每个人都在使用同一个应用程序,我告诉 Lu。在 iOS 和安卓(Android)生态里,我们已经拥有了某种程度上的这个版本的未来。

“但你知道,旧的操作系统是建立在这种不再适用的应用程序模型之上的。也许我们需要打造一个操作系统,”他说。

“Cursor 操作系统?”我问。

“是的,”Lu 说。“我不知道。这很简单。现在,你只需要使用智能体蜂群(agent swarm),然后让他们在上面工作大概一周就行了。”【懂】

欢迎加入经叔的知识星球。在这里,我们拒绝无用的焦虑,只谈底层的逻辑与实战的干货。我会结合最新的AI前沿动态、深度的商业创新分析(如一人企业的构建)和独特的文化思潮(如麦克卢汉的媒介洞察),帮助大家把握时间窗口。

欢迎订阅不懂经知识星球,星球即将涨价。

我是不懂经的经叔,国内最早翻译介绍了纳瓦尔的《如何不靠运气获得财务自由》,以及影响了纳瓦尔、中本聪、马斯克等大佬的《主权个人》。

不懂经知识星球,众多百万粉丝大V、千万及亿万富翁订阅。专注分享一人企业、一人创投主题,关键词:AI、IP、创投、科技及商业前沿的高杠杆内容。

打开网易新闻 查看精彩图片

愈懂愈自由