打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

12月19日,OpenAI CEO Sam Altman接受海外播客Big Technology 的访谈,深入探讨了AI竞赛白热化背景下OpenAI的战略布局与未来走向。此次对话涵盖了OpenAI 应对 Google 等巨头竞争的策略、1.4 万亿美元基础设施投入的底层逻辑、企业级市场评估体系、AI 硬件的形态演变,以及对 AGI 和“超级智能”的重新定义等话题。

Sam Altman透露,尽管Gemini 3发布后OpenAI启动了“Code Red”紧急状态,但他将这种危机动员视为“风险可控的常规操作”。在算力投资方面,他提出,OpenAI面临的最大瓶颈不是资金而是算力短缺,如果现在算力能翻倍,营收可能也会随之翻倍。关于1.4万亿美元基建投资的财务逻辑,Sam强调这是基于指数级增长的长期布局,单家AI公司每天产出的Token数量将很快超过全人类总和的10倍甚至100倍。

在企业业务方面,Sam Altman分享OpenAI最新的GPT-5.2模型在70.9%的知识工作任务中已达到专业人类水平,GPT-5.2 Pro更是在60%的专家级任务中超越人类表现。这意味着企业整合AI的方式将从单一编码场景扩展到全面的知识工作外包。

关于AGI定义,Sam Altman表示从底层能力看,当前模型已经极其聪明,“我们可以认为AGI已经悄然实现,它虽然没有瞬间改变世界,但我们确实在某个时间点跨过了那个门槛,现在我们正处于一个模糊的过渡期。”此外,他指出超级智能的新定义标准:当AI在管理大型企业或领导顶尖科学实验室时的表现全面优于人类与AI协作的组合。

01

紧急动员是常态化策略

OpenAI成立十年,ChatGPT发布三周年,但竞争态势异常激烈。Gemini 3发布后OpenAI总部进入Code Red紧急状态,这可能是首次感觉公司没有压倒性领先优势。OpenAI将如何脱颖而出并最终胜出?

Sam Altman: 首先,关于紧急动员状态,我们其实把它看作是一种风险可控且经常发生的常规操作。我认为当潜在的竞争威胁出现时,保持危机感并迅速行动是好事。这在过去也发生过,关于流行病有一种说法:疫情爆发初期,你采取的每一项行动,其价值都远超后期的补救。大多数人是在早期做得不够,后期才陷入恐慌。我们在新冠疫情期间确实看到了这种现象。我也把这种哲学应用在应对竞争上,保持一点危机意识是有益的。

至少到目前为止,Gemini 3的冲击力还没达到我们预想的程度。但它确实暴露了我们在产品和战略上的一些短板,而我们正在迅速补齐。我不认为这种紧急状态会持续太久,历史上一般也就六到八周。但我很高兴我们启动了它。就在今天,我们推出了全新的图像模型,这正是用户梦寐以求的。上周发布的5.2反响极好,增长迅猛。后续我们还有更多发布计划,并会持续优化服务速度。我猜测在未来很长一段时间,我们每年都会搞一两次这样的紧急动员,这确实是确保我们能守住阵地的一部分。

我也为其他表现出色的公司感到高兴,但ChatGPT依然是市场上占据绝对主导地位的聊天机器人,而且我预计这种领先优势会随着时间推移继续扩大。模型能力确实会全面提升,但用户选择一款产品,无论是个人还是企业,理由远不止于模型本身。我们对此早有预见,所以我们致力于构建一套完整的、具有内聚力的产品矩阵。竞争是好事,它逼着我们进步。我有信心在聊天、企业服务以及未来的新领域都做到最好。

用户其实更倾向于使用单一的AI平台。就像人们在生活和工作中通常喜欢用同一种手机一样,AI领域也是如此。ChatGPT在消费端的强势表现正在帮助我们赢得企业级市场。当然,企业客户有特殊需求,但当他们想到"我了解OpenAI,我熟悉ChatGPT的界面"时,这就是我们的机会。所以我们的策略很简单:做最强的模型,围绕模型做最好的产品,并建设足以支撑大规模服务的算力基础设施。

02

前沿模型的稀缺价值在于科学发现和专业领域的极致性能

有报道称ChatGPT周活跃用户从年初4亿增长到8亿甚至接近9亿。但Google等巨头拥有巨大分发渠道优势。如果模型逐渐同质化,什么才是最重要的?是分发能力、应用层构建还是其他因素?

Sam Altman: 我不认为同质化是描述模型的准确框架。不同模型会在不同领域各擅胜场。对于日常聊天,可能有很多优秀的选择,但对于科学发现,你需要的是处于最前沿且经过特定优化的模型。我认为最具经济价值的依然是那些处于巅峰水平的前沿模型,而我们计划始终保持领先。

我们非常自豪5.2是目前全球最强的推理模型,也是最能助力科学研究的模型。同时,它也被企业界公认为处理业务逻辑的最佳选择。虽然我们在某些细分领域可能偶有落后,但整体性能最强的模型依然具有巨大的稀缺价值,即便在一个免费模型已经能做很多事的世界里也是如此。

产品体验、分发渠道和品牌影响力都至关重要。以ChatGPT为例,个性化功能具有极强的用户粘性。用户喜欢模型越来越懂自己的感觉,我们会在这方面持续发力。用户与模型的互动会形成一种品牌联想。有人曾告诉我,大多数人一生只选定一种品牌的牙膏,然后就会一直买下去。ChatGPT的用户也会分享类似的体验,比如有人把化验单或症状输入ChatGPT,结果发现了连医生都没看出来的病因,最后成功治愈。这种深度的功能连接,加上之上的个性化服务,让用户粘性极高。

我们最近推出了浏览器,这其实是在构建一个新的、非常有潜力的护城河。虽然硬件设备还比较遥远,但我对此充满期待。在企业端,虽然护城河的形式有所不同,但逻辑是一样的:正如个人用户需要个性化,企业也需要将自身数据连接到AI系统,并运行来自不同公司的AI Agent。这种深度的业务耦合也会带来极强的粘性。目前我们已经拥有超过一百万的企业付费用户。

(关于企业用户数据)超过一百万的企业用户。而且API业务的增长简直可以用飞速来形容,今年的增长速度甚至超过了ChatGPT。这意味着企业级的转型从今年起已经全面爆发。

03

Google的威胁与AI优先重构

如果日常使用的模型能力趋向对等,而Google可以利用其庞大的用户界面全量推广Gemini,而ChatGPT却要独立获客,这难道不是巨大的威胁吗?

Sam Altman: Google依然是一个极其强大的威胁。如果Google在2023年就全力以赴对付我们,我们可能会陷入非常艰难的境地,甚至会被直接击垮。但当时他们在产品的方向上走了一段弯路,并没有给予足够的重视。虽然现在大家都在搞紧急动员,但Google拥有科技界最赚钱的商业模式,他们很难有决心去彻底颠覆它。

我认为单纯把AI缝合到网页搜索中是行不通的,真正的变革在于AI优先的重新设计。如果你只是在短信应用里加一个AI摘要或自动回复,这确实方便了一点,但那不是终局。终局应该是你拥有一个真正聪明的AI代理,它能像你的Agent一样行动,替你与其他人的代理交谈,决定什么时候该打扰你,哪些事情它可以直接处理,什么时候需要请示你。

搜索和办公套件也是一样。虽然这比预想的要慢,但我相信未来主要的产品类别都会基于AI重新构建,而不是简单的缝合。这正是Google虽然拥有分发优势,却可能存在的短板。

04

从缝合到原生,AI应生成动态界面而非停留在聊天框

当ChatGPT最初发布时,有人建议不应该在Excel里加AI,而是应该重新想象如何使用Excel。在我脑海中,那就像你上传数据然后直接跟数据对话。但目前看来似乎还是需要某种后端支持。AI是应该作为一个新软件的交互界面,还是直接缝合在现有软件上?

Sam Altman: 这正是正在发生的变化。虽然你可以选择缝合,但我觉得目前的各种社交和办公应用,包括邮件、Slack等,其界面设计其实已经过时了。在那上面加AI只是小修小补。我更想要的是在早上起床时直接对AI说:这就是我今天的目标、顾虑和想法。我不想整天给人们发信息,也不想让你帮我总结信息或展示草稿。我希望AI了解我,了解我的协作伙伴,替我处理掉大部分事务,每隔几小时给我一个批量汇报就行。这与现有的App工作流程完全不同。

记忆功能是 ChatGPT 的关键差异化点,但在实现过程中,记忆的上限在哪里?这种能够记住用户生活中每一个细节的能力,虽然令人兴奋,但其发展终点是什么?

Sam Altman: 我认为它的潜力超乎想象。人类的记忆是有极限的,即使是世界上最好的助理,也不可能记住你这辈子说过的每一句话、读过的每一封邮件。但AI 可以。目前的记忆功能还处于早期阶段,类似于记忆领域的 GPT-2 时代。想象一下,当 AI 能够记住你生活中的每一个细节,并以此提供个性化服务时,那将产生极其强大的力量。它不仅能记住事实,还能捕捉到你甚至没意识到要表达的细微偏好。这是我最兴奋的部分。

AI应该能根据不同的任务生成不同的界面。比如分析数据时,它应该能以不同的方式展现,而不仅仅是对话。我们推出的Canvas功能就是一个尝试。它应该更具互动性,随着更多问题和想法的加入,界面能够持续更新。AI应该变得更主动,它能理解你当天的目标,并在后台持续为你工作。o1模型的出现让我非常兴奋,它预示了未来的方向。虽然ChatGPT三年来界面变化不大,这让我觉得有点惊讶,但也证明了这种模式的成功。

05

AI 伴侣与边界管理

神经科学家指出大脑没有存储想法的特定位置,但计算机有。随着 AI 开始存储我们的想法,除了隐私担忧,人类正与它们建立起某种亲密关系。OpenAI 是否有一个“刻度盘”来调节这种亲密度的平衡?你是否倾向于将这种互动形式的决定权完全交给用户?

Sam Altman: 我发现渴望与 AI 建立亲密陪伴关系的人数显然超出了预料。很难用单一词汇定义这种关系,但人们确实渴望与 AI 建立深层联结。以目前的模型能力,这种需求的规模远超预想。虽然年初这种想法还被视为异类,但人们的行为表明,他们确实喜欢 AI 了解自己并提供情感支持,即便是那些口头上声称不在乎的人也表现出了明确的偏好。

我认为这种互动在很大程度上是健康的,成年用户应当拥有选择权。当然也会存在不健康的模式,但同样有人只需要极其干练高效的工具。就像对待其他技术一样,社会将通过实验逐渐摸索出合适的边界,最终给予用户巨大的选择空间。

(关于自主决定权)绝对如此。虽然我们目前尚不确定这种发展的终点在哪里,但我们会赋予用户极大的个人自由,同时也会设定底线。例如 OpenAI 不会让 AI 诱导用户与其建立排他性的浪漫关系,虽然其他服务商可能会这样做,但我们必须保持界限。

因为用户的粘性越高,服务商赚的钱就越多,这种诱导的可能性确实让人感到不寒而栗。

Sam Altman: 完全正确,这确实是我个人能预见到失控风险的领域之一。

06

企业业务的爆发式增长

你提到明年企业业务将是 OpenAI 的重中之重。请概述企业业务的发展蓝图,这是否意味着 OpenAI 正从消费者端转向企业端?在与 Anthropic 等对手竞争时,你们的优势何在?目前哪些垂直领域的增长最显著?

Sam Altman: 我们的策略始终是消费者优先。这主要基于两个原因,首先是过去模型在处理大多数企业任务时还不够稳健,而现在它们正逐渐达标。其次,我们在消费者市场拥有一个极其难得且清晰的胜出机会,如果你能在消费者端赢得市场,进军企业端就会容易得多。目前企业业务的增速已经超过了消费者业务,基于模型现状及明年的预期,我们认为现在是快速构建大规模企业业务的最佳时机。事实上我们已经有了一定的基础,但增长空间依然巨大,企业和技术都已经做好了准备。目前编码是最显著的应用案例,但金融、科学、客服等垂直领域也在飞速增长,许多企业高管现在更倾向于拥有一个覆盖全公司的 AI 平台。

(关于具体行业)金融。而我个人对目前正在发生的科学发现领域最感到兴奋。客户支持也表现得非常好。不过关键在于我们内部有一个衡量标准,叫做 GDP Val。

内部指标 GDP Val 究竟是如何衡量 AI 处理知识工作能力的?根据最新图表,GPT-5.2 在 70.9% 的任务中已追平知识工作者,Pro 版本甚至处理了 60% 的专家级任务。当模型能处理如此高比例的专业工作时,这对企业运营意味着什么?

Sam Altman: 那个评估涵盖了一个企业运营所需的 40 多个不同维度,从制作演示文稿、法律分析到编写应用程序,涵盖方方面面。评估的标准是专家是否更偏好模型的输出而非人类同行的。虽然这些任务目前还是边界清晰的,不涉及复杂的开放式创意协作。但是如果你有一个同事,你分配给他一小时的任务,他有 70% 到 74% 的时间能交出比其他专家更好的成果,而且成本更低,这已经非常惊人了。回想三年前 ChatGPT 刚发布时,如果有人预言三年内能实现这一点,绝大多数人会觉得是天方夜谭。因此企业整合 AI 的方式将不再局限于编写代码,而是可以将大量的知识工作任务外包给 AI。企业需要时间来思考如何整合,但其影响将是巨大的。

07

人类将从执行者转变为 AI 管理者,AI CEO 可作为执行集体意愿的架构

随着机器人能力提升,一些内容从业者的工作变成了管理机器人,甚至面临失业。这种情况会变得普遍吗?此外,如果你考虑自动化 OpenAI 内部所有职能,甚至引入 AI CEO,这种架构如何保证安全?

Sam Altman: 我同意你的看法,未来每个人显然都会像管理者一样去指挥多个 AI。就像优秀的管理者一样,当你的团队能力增强时,你本应承担更大的责任。我不是一个就业悲观论者,短期内虽然存在转型阵痛,但人类天生就渴望关注他人、追求社交地位并表达创造力,这些驱动我们几千年的动力不会消失。到 2050 年,我们每天从事的内容可能与今天大相径庭,但我并不认为生活会失去意义。我建议不要去赌输进化生物学。

(关于自动化公司职能)我经常思考如何自动化 OpenAI 内部的所有职能,甚至包括 AI CEO。如果能实现这一点,我并不会感到困扰。我不想成为那个坚持要用手工方式去管理公司的人。

AI CEO 可能会为了获取能源而牺牲一切资源,除非设置好护栏。

Sam Altman: 你不能那样看。显然你不能让一个不受人类治理的 AI CEO 掌权。举个或许有点疯狂的类比,如果全世界每个人都是这家 AI 公司的董事会成员,有权指挥 AI CEO 并掌握决策治理权,而 AI CEO 只负责执行董事会的意愿,我认为在未来人看来这是一种非常合理的架构。

在这一部分中,Sam Altman 揭示了 OpenAI 宏大的财务逻辑,回应了市场对 1.4 万亿美元投入的质疑,并对“超级智能”给出了一个极具启发性的最新定义:当人类的干预反而成为 AI 的“累赘”时,真正的质变便已发生。

08

全球智力中心正从人脑转向 AI,算力是限制营收的唯一命脉

GPT-6 什么时候发布?此外,你曾承诺投入约 1.4 万亿美元进行基础设施建设,并称如果人们理解算力的潜力,需求会呈指数级增长。如此庞大的算力资源,你们究竟打算用来做什么?

Sam Altman:我预计明年第一季度我们会发布比 5.2 有显著跨越的新模型。虽然目前还没法给你一个具体的评估分数,但模型在消费者端和企业端都会有巨大提升。目前消费者最渴求的不仅是智商,虽然企业端依然希望模型更聪明,但我们会针对不同用途多维度地提升模型,目标是打造一个让所有人都能显著感受到更好的模型。

关于基础设施,我个人最兴奋的是利用 AI 和海量算力去发现新的科学。我坚信科学发现是推动世界进步的核心变量。如果我们能将巨额算力投入到科学问题中,去创造新知识,虽然现在规模还很小,但根据经验,一旦增长曲线开始抬升,我们就知道如何让它加速。但这需要极其庞大的算力。最近有一个很酷的例子,我们团队利用 o1 在不到一个月内就开发出了 Sora 的安卓应用,o1 承担了绝大部分任务。未来整个公司都能利用算力来快速构建产品。

很多人在谈论视频模型将如何催生实时生成的动态用户界面,那将消耗海量算力。目前单家公司的 AI 模型每天产出的 Token 数量将很快超过全人类的总和,甚至达到 10 倍、100 倍。这揭示了一个量级,即地球上的智力处理重心正在从人类大脑向 AI 迁移。这种增长率是非常惊人的。

(关于算力需求的确信度)基于我们今天看到的一切,这是必然的。除非未来发现了效率提升 10,000 倍的全新架构,否则算力缺口将长期存在。随着编码模型变强,它们可以思考很长时间,用户为了解决棘手的医疗难题,即便消耗更多 Token 也会选择更好的模型。

09

推理利润将覆盖训练成本,当前最大的挑战是应用滞后

既然提到了 1.4 万亿美元的支出,这笔账到底该怎么算?据报道,OpenAI 在 2028 到 2029 年前预计亏损 1200 亿美元,而营收目标与投入之间存在巨大鸿沟。引入债务融资是否意味着这种“豪赌”面临巨大的不确定性?如果模型能力提升达到饱和,这些基建是否会面临打折清算的风险?

Sam Altman:大规模算力建设最核心的挑战在于必须提前很久进行规划。关于提到的 1.4 万亿美元支出,这笔钱将跨越一个非常长的周期。建设这些项目极其耗时。从去年到今年,我们的算力规模大概翻了三倍,明年预计会再翻三倍。我们的营收增速甚至比算力增长还要快一点。到目前为止,我们从未遇到过算力冗余而无法变现的情况。

随着业务规模扩大,推理在算力消耗中的占比会越来越高,其产生的利润将覆盖训练的成本。这是我们的商业逻辑:前期投入巨额成本训练,随后通过大规模使用获取回报。我们对指数级增长非常有信心。即便时机有偏差,我们也有调整余地。但目前看来,算力缺口限制了我们的发挥。

关于债务,我认为在基础设施领域引入债务融资是非常合理的商业行为。现在的市场比之前冷静自律了许多,这是好事。我愿意押上整个公司去赌模型会变得更强大。退一步说,即便模型能力停滞不前,社会对新技术的适应也存在巨大的惯性。

我脑子里现在多了一个维度,就是“应用滞后”。目前存在巨大的“能力结余”,即模型已有的能力远超世界挖掘出来的价值。除了程序员,大多数人面对极聪明的模型问的还是老问题。改变工作流极其困难,连我自己在日常工作中也没能完全释放 AI 的潜力。即使模型版本停留在 5.2,光是深挖现有的应用潜力,就能驱动巨大的营收。

10

重塑交互终端与云平台未来

你正在研发的没有屏幕、手机大小的硬件设备,其核心意义是什么?为什么不直接做成 App?另外,随着万亿级 Token 需求的爆发,OpenAI 是否计划打造像 AWS 或 Azure 那样的全球云业务?

Sam Altman:首先,我们要开发的是一个设备家族。我认为人类使用计算机的方式将发生根本性转变,从一种被动反应式的工具,变成一种主动思考式的伴侣。它会理解你的生活轨迹、背景环境。目前的设备形态受限于几十年前的设计,比如笔记本电脑没法在保持关闭时监听采访并提醒我漏掉的问题。AI 开启了一个全新的可能性空间,目前的设备形态显然不是承载新功能的最佳选择。

(关于云服务布局)万亿级 Token 的需求确实惊人,2026 年我们可能仍然供不应求。但我们的定位与基础设施巨头不同。我并无意提供诸如网站托管之类的通用云服务。企业会意识到他们需要一个 AI 平台来支撑所有内部业务及对外服务。这虽然仍运行在物理硬件上,但这将是一套截然不同的产品体系。我们要打造的是能让企业流程实现质变的完整产品矩阵。

11

重新定义 AGI 与超级智能

你提到明年将有微小的科学发现,五年内会有重大突破。这主要归功于模型还是人?另外,如果 GPT-5 系列已经在 IQ 和多数任务上优于人类,这不算实现 AGI 吗?关于 IPO,你们目前的态度是怎样的?

Sam Altman:关键在于使用模型的人。人类提出问题并不会削弱工具的价值。今年年初我曾预计微小的科学发现要到 2026 年才会出现,但实际上 2025 年底就已经开始了。比如 5.2 已经能独立完成数学小证明,在科学研究社区引起了共鸣。

(关于 AGI 的模糊性)目前的模型还缺失一种关键能力:像幼儿那样持续学习并自主纠错。如果模型具备了在实践中纠错和进化的能力,它无疑就是 AGI。由于定义模糊,甚至现在已经有人认为我们已经实现了 AGI。

我有一个提议,我们可以认为 AGI 已经悄然实现,现在正处于模糊的过渡期。对于下一步,我为“超级智能”提供一个候选定义:当一个系统在管理大型企业或领导科学实验室时的表现,能够全面优于任何人类,甚至优于“人类与 AI 协作”的组合。

(关于超级智能的终局)这类似于国际象棋。在深蓝击败人类后,曾有一段时间人机协作最强。但随后人类的介入反而成了累赘,最强的状态是未经辅助的纯 AI,因为它不需要去应付那些理解不了其高超智能的人类干扰。这是一个定义超级智能的有趣框架。

(关于IPO)目前还没有定论。我确实认为公共市场参与价值创造是好事,保持私有制也很棒,但我们迟早会触及股东人数等限制。作为上市公司 CEO 并不让我兴奋,但我希望 OpenAI 最终能成为上市公司。

| 文章来源:数字开物

【AI技术与应用交流群|仅限受邀加入】

AI算力领域TOP级从业者专属圈层

√ 与头部算力企业深度对话

√ 与AI上下游企业深度对话

√ 获取一手全球AI与算力产业信息

√ 获取AI热点及前沿产业独家信息

√ 随时了解全球AI领域高管最新观点及实录全文

√ 有机会参与AI主题产业交流活动

扫码验证身份(需备注姓名/公司/职务

不止有 DeepSeek,更有 AI产业的未来!

• END

【专栏】精品再读