打开网易新闻 查看精彩图片

作者| 沐风

来源| 创头条

随着OpenAI 推出下一代推理模型o3和o3mini,为期12天的年底大促直播,拉下帷幕。

略低于的预期的是,OpenAI并未发布GPT-5或4.5。

日前,据《华尔街日报》爆料,OpenAI GPT-5 研发进度不仅落后于原计划,且进度不顺,投入与产出落差比较大。

据悉,该项目已开发超过18个月, 也就是说GPT-5已至少完成2轮训练,每次长达数月,但每次训练后,都遇到新问题。

报道还称,OpenAI 除了依赖公开数据和许可协议外,还雇佣了人员通过编写代码或解决数学问题,来创建全新的数据。此外,公司还在使用其另一个模型 o1 生成的合成数据。

因此,更有可能的事实是,GPT-5并不是OpenAI藏着不发,而是没准备好。

热闹褪去。反观这12天的密集大促,亮点屈指可数,比如Sora,比如语音搜索。

做个小测试吧,这次OpenAI连续12天的直播是否达到你的预期?

其中,Sora发布后,一度遭到尝鲜用户的吐槽,被指还不如中国的可灵、海螺AI。

从跳票,到塌方,Sora 可谓OpenAI的一大污点。于此,对公司非议最多的就是,Openai 很长于营销,这在其冠冕“全球AI 之王”中,起了不小的作用。

而产品端的进度与表现,则屡屡不如预期。这种反差很要命。

更要命的是,之前被认为一直落后的Google 后劲十足,呈现全面赶超的势头。

我们不妨来看看,Google在OpenAI 年底直播季的成绩单。

1、Gemini 2.0 Flash:Google的AI模型的一个测试版本,具有更快的响应时间,专为使用多种类型输入和输出的交互式体验而构建。

2、Veo 2:视频生成器,可以从文本提示中创建逼真的4K视频剪辑,并具有可调节的相机和拍摄选项。

根据早期结果,许多AI图像专家称这是迄今为止最好的视频合成模型。

3、Imagen 3:Google的新文本到图像模型,能够以各种艺术风格创建具有精细细节、照明和构图的图像。

4、Gemini 2.0 Flash Thinking:这是一个运行时“推理”AI模型,类似于OpenAI的o1,它使用额外的推理运行时间试图以更高的准确性解决更复杂的问题......

其中还包括之前发布的Project Astra、Project Mariner等更新,都融入了Gemini 2.0。

尽管在营销手段上,不如12天直播这样的轰动,但全家桶的产品硬实力让 OpenAI 承压很大。

天道好轮回。

OpenAI是当年马斯克与奥特曼为了反抗Google霸权的产物。过去OpenAI常常在Google预期发布产品前,推出新品,屡屡得手,但现在情况似乎反过来了。

比如,Google通过发布Gemini Flash 2.0展示了流媒体图像和视频,而OpenAI在一天后才将此功能添加到ChatGPT中。

据lmarena.ai分析,LLM过去6个月,OpenAl与Google两个实验室领先于市场。

并且,在2024年11月17日开始Google的Elo得分就开始逐渐反超OpenAl。

打开网易新闻 查看精彩图片

根据OpenRouterAI的数据,Google Gemini在开发者中的市场份额从9月份的约5%,上升到了最近的>50%市场份额。

另外,在一些细分领域,OpenAI已经王位不保。

比如,OpenAI“叛军团”组成的的公司Anthropic,在AI编程领域已经领先于ChatGPT。

Anthropic的七位联合创始人全部来自OpenAI。

打开网易新闻 查看精彩图片

据The information报道,今年秋季OpenAI开展了一次内部基准测试。

测试结果却是Anthropic的AI编程模型Claude,在关键指标上超越了OpenAI自家的模型。

并且,OpenAI去年投资的初创公司Cursor,在今年7月做出决定,将其默认使用的AI模型从GPT换成了Claude。

Cursor联合创始人Aman Sanaer公开称赞Claude“是当前最佳的编程工具”。

另一家代码辅助工具公司Source graph也选择了Claude 3.5 Sonnet作为其默认模型。

他们的数据显示,用户有66%的时间都偏爱Anthropic的模型,而非倾向于OpenAl、谷歌等其他产品。

客服公司Intercom 也宣布将其客服工单处理AI聊天机器人Fin的底层技术,从OpenAI大模型切换为Claude。

结果表明,Claude将客服工单的自动解决率提升至51%,而此前由OpenAl模型驱动的Fin的工单解决率仅为23%。

Anthropic负责增长和收入的主管Kate Jensen透露,过去三个月,公司来自AI编程客户的年化收入增长了惊人的10倍。

还有消息称,Anthropic已经完成下一代AI大模型 Claude 3.5 Opus 的训练。

妥妥的不断压制。

根据风投机构Menlo Ventures的数据,今年OpenAI在企业AI领域的市场份额从50%下降至34%,而Anthropic的市场份额翻了一番,从12%增至24%。

OpenAI接下来的挑战看起来还会更大。

这不仅表现在如上的产品力方面——OpenAI核心技术人员的离职不断,导致的结果还会不断显现。

更重要的是,公司治理、商业化进程等所组成的可持续发展力方面。

众所周知,AI是一个十分烧钱的行业。

OpenAI被爆出的融资材料显示,OpenAI 预计2023年-2028年期间,总亏损(不包括股权补偿)将达到440亿美元。其中,预计2025年的亏损140亿美元,是2024预期亏损的近三倍。

而OpenAI已有的盈利模式,大都利润不高,跟不上烧钱的速度。

最近消息显示,OpenAI正在将其商业化团队扩充到300多人,并讨论在AI产品中开发广告等营收模式。

但不管怎样,作为一个组建没几年的创业公司,与Google这样的醒过来、缓过来巨头相比,还是会相形见绌。

如此种种,可见昔日“AI 之王”头上的皇冠正摇摇欲坠。但AI之漫漫长跑,才刚刚开始,竞逐者的游戏中,不断反转,甚至后来者斜刺的情节,或会不断上演。

图片来源|网络