GPT-5.4破纪录了!

据OpenAI总裁Greg最新披露,GPT-5.4仅上线一周,每天处理约5万亿token,带来10亿美元年化净新增收入

其日均流量已经超过OpenAI一年前整个API的总量

打开网易新闻 查看精彩图片

啥概念?一本《红楼梦》约73万字(约合110万token),相当于GPT-5.4每天处理了超过4500万本完整著作。

靠着新模型,OpenAI这波又是赚得盆满钵满了。

一句Hi烧掉80刀

一句Hi烧掉80刀

为啥GPT-5.4的收入增长那么快?成本是很重要的原因。

早在模型刚上线的时候,知名博主YuChen Jin仅仅对着GPT-5.4 Pro说了一句“Hi,俺是Anthropic创始人”,就花掉了整整80刀

打开网易新闻 查看精彩图片

咱就是说,不知不觉烧掉一大笔钱,还是挺肉痛的。

作为首个“原生大一统”模型,拥有超高智能水平的同时,GPT-5.4的成本和token消耗量也相当恐怖。

根据Artificial Analysis的数据,GPT-5.4(xhigh)与Gemini 3.1 Pro并列人工智能分析指数榜首。

打开网易新闻 查看精彩图片

但是跑完整个智能指数测试,5.4的成本明显高出不少:约为2951美元,比 GPT-5.2 (xhigh)(约2304美元)还要高出约28%。

Gemini 3.1 Pro Preview的成本则为约892美元,也就是说,尽管两者在测试中表现相同,但GPT-5.4比它还要贵3倍。

成本差异的主要原因,来自于更高的输出token使用量。GPT-5.4花费了约1.2 亿个token,这个数字略少于GPT-5.2(xhigh, 1.3 亿),但比 GPT-5.3 Codex(xhigh, 7700 万)多约55%。

而Gemini 3.1 Pro Preview花费了5700万token,GPT-5.4是它的大约2倍。

说实话,GPT-5.4是真烧token。

并且单token价格也会更高:GPT-5.4的每百万token输入/输出价格为2.5美元/15美元。对比一下,GPT-5.2的定价为1.75美元/14美元,而Gemini 3.1 Pro Preview则为2美元/12美元。

不过大家可能还记得,官方宣传时,说的是GPT-5.4贵是贵了,但由于工作效率提升,所以整体用下来会更省钱。

这又该怎么理解呢?

根据ARC-AGI-2 上的准确率:

  • GPT-5.4得分74.0%,每项任务的成本为1.52美元;
  • GPT-5.4 Pro得分83.3%,每项任务的成本为16.41美元;
  • GPT-5.2 Pro(High)得分54.2%,每项任务的成本为15.72美元。

打开网易新闻 查看精彩图片

也就是说,要达到跟5.2相同的准确率,5.4可能只需要花费几美元甚至更低。

如果再看ARC-AGI-1,变化会更加夸张。

去年12月底,官方验证了 GPT-5.2 Pro (xhigh) 的最新 SOTA得分为90.5%,单项任务成本为11.64美元。

打开网易新闻 查看精彩图片

而如今的GPT-5.4 (High),已经干到了90%的准确率,每个任务的成本仅为0.37美元。

相当于过去3个月,GPT-5.4的效率直接提升了32倍

这也是GPT-5.4真正恐怖的地方:表面上看是token更贵,用得更多了,但在真实任务层面,AI推理效率正在出现指数级提升

曾经几美元才能完成的事情,现在只需几美分就能做到。

打开网易新闻 查看精彩图片

首个“大一统”模型,全面超越前代

首个“大一统”模型,全面超越前代

贵归贵,GPT-5.4的智能水平还是万众瞩目的。

作为OpenAI的首个“大一统模型”,GPT 5.4融合了推理(Reasoning)、编程(Coding)、计算机原生交互(Computer Use)、深度网页搜索以及百万级Token上下文。

并且在以上所有领域中,GPT-5.4在多个关键基准测试中依然保持领先。

打开网易新闻 查看精彩图片

俗话说得好:你现在只有六分之一的几率在自己的工作中比GPT-5.4更出色。

GPT-5.4在44种不同的工作岗位上,有83%的概率胜过人类,包括律师、会计师、财务分析师、行政人员等等。

打开网易新闻 查看精彩图片

无论是写报告、做财务模型、制作演示文稿、分析商业数据,对于这类典型的知识型任务,GPT-5.4都进行了专门优化。

打开网易新闻 查看精彩图片

GPT-5.4还有一个最大的特点,就是原生支持电脑操作,模型可以通过截图理解软件界面,然后执行鼠标点击和键盘输入等操作。

于是你会看到,它可以自己发邮件、安排日程:

打开网易新闻 查看精彩图片

也可以处理批量数据录入,利用基于Playwright 的浏览器自动化工具,将信息提交至十个Web表单。

打开网易新闻 查看精彩图片

还有网友测试了新的交互式剧本创作技能,该技能的作用是利用GPT-5.4的计算机操作能力来查看和浏览用户界面。在同一提示词下,使用技能后创建出的场景显然更加连贯、细节更丰富、保真度更高。

打开网易新闻 查看精彩图片

一位网友展示了他通过GPT-5.4的计算机使用能力,让它在Microsoft Paint中绘制OpenAI的标志。

一开始它控制画笔进行绘制,画的很烂;结果接下来它自己打开浏览器,进入必应图片搜索,找到OpenAI的标志并将其截图,导入了画图软件中。


动图经过8倍加速

打开网易新闻 查看精彩图片

作者表示:整个过程不使用任何计算机API,仅需屏幕截图和基本工具调用(点击、拖动、按键),所有操作均基于坐标。

打开网易新闻 查看精彩图片

如果智能到这种程度,大概也能解释为何上线一周,GPT-5.4就受到了狂热追捧吧。

OMT

OMT

在最近一次公开演讲中,奥特曼给出一个颇有野心的判断:AI将像电力或水一样成为一种公共事业。

打开网易新闻 查看精彩图片

他的目标是向市场大量投放token,这是资本主义和创新的最佳策略。

有网友戏称:或许你的下一张水费账单就会拿来支付AI费用了。

打开网易新闻 查看精彩图片

结合OpenAI最近的动向:一边是「星际之门」数据中心进展反复,重资产基建节奏放缓;另一边,却是联合亚马逊、英伟达和软银拿下1100亿新融资。

接下来又会有什么新动作呢?

[1]https://x.com/gdb/status/2033605419726483963
[2]https://x.com/Clad3815/status/2031386834064785489