OpenAI深夜搞出大动静,推理成本直接砍半,GPU用量从几万张降到几百张,AI应用股民怕是要睡不着了,明天行情一触即发?
你可能要问,几百块GPU和之前比差多少?就这么跟你说,ChatGPT月活用户数亿,按行业常规的算力配置,应付这么大流量得上万颗甚至几万颗GPU。现在几百颗就能兜住,这效率提升的幅度,说是降维打击一点不过分。而且据The Information的报道,OpenAI把这套优化方案当成了"秘方",内部搞了严格的访问控制,其他部门的人都不让看,就怕技术外泄被竞争对手学走。你想想,得是多核心的技术,才值得这么严防死守?
这事一出,最直接的影响就是OpenAI可以发动价格战了。前几天他们刚发了GPT-5.6系列,旗舰版Sol的定价是输入5美元、输出30美元每百万Token,性能比Anthropic的Claude Mythos 5还强,但价格只有人家的一半。你说这招狠不狠?一边降自己的成本,一边用低价抢别人的客户,Anthropic那边定价偏高,本来就争议不断,现在更难受了。OpenAI正在准备1200亿美元的融资,投前估值7300亿美元,还在冲刺IPO,这种时候利润率改善的故事,对投资人来说太有吸引力了。
你别觉得这只是美国那边的事,跟A股没关系。恰恰相反,这消息对A股的AI应用板块,是实打实的基本面级利好。做AI应用的核心痛点在哪?就在推理成本。不管是做内容生成、代码助手、智能客服还是各种AI工具,用户每一次提问、每一次生成结果,都是在烧算力钱——这是整个行业最大头的运营支出,也是卡着很多公司盈利的核心门槛。现在成本直接腰斩,相当于打开了两扇大门:要么,同样的营收规模下,利润翻倍了,以前那些勉强保本的服务,直接变成高毛利的生意;要么,直接降价抢市场,用户量和订单量能快速起规模,整个行业的商业化节奏直接提速一大截。之前市场总说AI应用是炒概念、没实锤业绩,现在最核心的成本瓶颈被砸穿了,整个赛道的盈利逻辑都顺了。
不过话说回来,成本降了,钱就一定进应用层的口袋吗?这事儿没那么简单。钛媒体有篇分析说得很透:模型降价,是全行业的共同成本下降,不是你家独有的优势。这东西就像水电一样,大家都能用,最后省下来的钱不一定变成利润,很可能变成下一轮价格战的弹药。所有人把降下来的成本让给用户,再在获客上把钱烧光,最后一起卷回原点。真正能让一家公司活下来的,是对某个具体场景的理解、和客户之间攒下的信任、能不能把活儿稳定交付。应用层真正的护城河,从来不是Token便宜,而是获客、留存、工作流嵌入和客户关系。举个例子,一个做法律合同审查的AI产品,模型读懂合同确实白菜价了,但客户真正愿意付费的,是你能不能识别他们公司自己的风险条款,能不能接进OA审批流,每一次审查能不能留下可追溯的审计记录,更关键的是,如果漏判了致命条款,你敢不敢负责。跨境电商的AI客服也一样,会说英语早就不值钱了,值钱的是能不能接进订单系统、退款规则和物流异常的流程里。
所以你看,OpenAI这次降本,确实把AI应用的商业化落地往前推了一大步,但具体到每一家公司能不能吃到红利,还得看它有没有在模型之外,建立起那层"嵌入、合规、兜底"的硬功夫。模型变免费原料之后,真正贵的东西,反而变成了模型外面的那一圈交付和服务。
热门跟贴