打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

夏至未至,大模型行业的价格战已经打到了白热化的程度。

过去一年,企业级大模型的Token调用成本暴跌了67%,开源模型拿下了企业Token调用量38%的份额。

就在一周前,DeepSeek扔下一颗深水炸弹——V4-Pro模型的API从临时打折变成永久降价,百万Token的输入缓存命中价格压到0.025元,网友戏称“收了个电费”。

行业还没缓过神的时候,527日凌晨,小米突然宣布MiMo-V2.5系列API永久降价,最高降幅高达99%不再区分上下文窗口长度。

短短几天时间,两条重磅消息把大模型赛道的价格锚点彻底打穿了。

打开网易新闻 查看精彩图片

MiMo亮剑,深夜降价

先说这次降价本身。

小米技术官方公告显示,MiMo-V2.5-Pro的输入缓存命中价格调整后仅为0.025元/百万tokens,相比原来256k规格的1.40元降了98%,对比长窗口的2.80元达到了99%的降幅。

标准版MiMo-V2.5也不含糊,输入缓存命中价格降到0.020元,较原价最高降了98%。

打开网易新闻 查看精彩图片

●图源:小米技术

也就是说,过去调用一次大模型的成本,现在能调用几十次甚至上百次。对此小米技术官方表示,这是一次对整个模型价格体系进行永久性翻新。

与此同时,TokenPlan计费体系也得到了优化。

此前不少开发者吐槽套餐价格偏贵、Token不够用,这次小米给出了“加量不加价”的方案:

同等付费价格下,可用Token数量提升到原来的5-8倍,计费规则简化为:不再区分上下文窗口长度,所见即所得。

此外,所有当前有效的TokenPlan用户额度在5月27日零点全部重置,按新规则执行,已经过期的历史付费用户据说也有惊喜。

打开网易新闻 查看精彩图片

●图源:小米技术

小米此次降价并非单纯的低价竞争背后是技术底座的持续迭代。

小米技术团队基于SGLangHiCache完整支持了SWA,将KVCache在多级存储之间的数据搬运量降到优化前的近1/7,可缓存Token数量提升近5倍,同时通过专家并行方案、输入长度分桶策略等优化,持续降低了单位Token服务成本。

目前MiMo-V2.5系列,已经覆盖商用普惠市场的主要场景。

可能很多人对Xiaomi MiMo的印象,还停留在“小米也做了个模型”上。

但实际上,XiaomiMiMo-V2.5-ProArtificialAnalysis榜单上综合智能指数和Agent指数均位列全球开源模型并列第一,跻身全球所有大模型总榜前五,与ClaudeOpus4.6GPT-5.4等闭源旗舰比肩。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

同一时期,MiMo-V2-Pro以超过30%的市占率登顶OpenRouter平台周榜第一,周调用量达到4.82万亿Token。

从追赶者到领跑者,小米AI只用了一年多的时间。

打开网易新闻 查看精彩图片

六百亿豪赌,雷军下注了

就在降价消息炸开的前一晚,5月26日,小米发布了2026年第一季度财报。

核心数据显示:总营收991亿元,经调整净利润61亿元,研发投入90亿元同比增长33.4%,研发人员总数突破2.6万人,硬核科技投入力度可见一斑。

财报明确提到,Xiaomi MiMo-V2.5-Pro已跻身全球开源模型双料第一,MiMo大模型助力HermesAgent登顶全球调用量榜首,成为第一贡献模型。

雷军明确对外表态:未来三年,小米在AI领域的投入将超过600亿元,今年至少160亿元。

打开网易新闻 查看精彩图片

●图源:小米

据悉,小米2025年全年总收入4573亿元,净利润不到300亿。这意味着小米未来三年要在AI上烧掉两年多的利润。

即便当年all in造车时,雷军也才说十年投入100亿美元,而AI的三年投入,年均超过200亿,力度之大前所未有。

小米AI业务的快速崛起,离不开核心人才的加持。

此前95后顶尖AI技术人才罗福莉加盟小米,曾在业内引发不小震动,传闻雷军以千万年薪力邀其加入。

在她的统筹下,MiMo从V2系列一路迭代到V2.5系列,4月23日更是一口气官宣了四款新模型,时隔上一代发布仅36天。

打开网易新闻 查看精彩图片

●图源:小米

如今,小米MiMo研发团队平均年龄仅25岁,清北毕业生占比超六成,年轻且顶尖的人才阵容为模型快速迭代提供了核心动力。

而罗福莉本人曾在多个公开场合表达过对AI前景的大胆判断,她认为大模型完全可能“自己左脚踩右脚提升”,甚至预言AGI将在两年内到来。这样的技术野心,显然需要真金白银来支撑。

预计小米全年研发投入将超过400亿元,而其中相当大的一部分会花在AI上。

打开网易新闻 查看精彩图片

●图源:小米

在AI加速重构“人车家全生态”的战略下,小米正把大模型能力注入手机、汽车、IoT全场景,从跨端AI Agent到车载语音助手,从智能家居到工业质检,每一块都在铺AI的底座。

打开网易新闻 查看精彩图片

汽车盈转亏,雷军慌不

如果说大模型降价是小米在进攻,那么Q1财报的另一面则揭露了这家公司正在承受的压力。

财报显示,小米集团总营收同比下滑10.9%至991.42亿元,经调整净利润60.72亿元,同比大跌43.1%,毛利同比下降14.2%,经营利润更是从去年同期的131.3亿元骤降至53.1亿元。

打开网易新闻 查看精彩图片

●图源:小米集团

可以看到,各条业务线的冷热分化非常明显。

手机×AIoT分部收入792.8亿元,同比下滑14.5%;智能手机出货量3380万台,同比下降19.2%。

但手机的平均售价却逆势涨到了1310元,创下历史新高,中国大陆高端智能手机销量占比也达到了23.5%。

这说明小米在主动收缩中低端机型、向高端要利润。

打开网易新闻 查看精彩图片

●图源:小米

IoT业务相对稳健,毛利率达到了25.2%的历史高位,境外IoT收入创下新高。但外界最关心的还是汽车。

一季度智能电动汽车及AI等创新业务收入198.6亿元,营收占比飙升至20%,已正式成为小米的第二大业务支柱。

当季交付80,856辆新车,在行业淡季和产品切换的双重压力下实现了同比增长6.6%。

然而,由于巨大的工厂折旧、产能爬坡和前瞻研发投入,汽车业务一季度净经营亏损达到了31.3亿元,在连续两个季度盈利之后,再度转亏。

怎么理解这个数字?

放眼同级新势力,一季度零跑以11.02万辆登顶销冠,理想以9.51万辆稳居第二,蔚来交付8.35万辆,小米以7.86万辆排名第四。

打开网易新闻 查看精彩图片

●图源:中汽数研

但零跑背后是五个以上的产品线在同时跑量,理想也是L系列加纯电五六个系列打天下,蔚来更是主品牌叠加乐道、萤火虫超过六个系列。

小米就SU7YU7两个系列。论每款车型的平均贡献效率,小米甩开所有对手不止一个身位;论产品线单一带来的结构性风险,小米同样甩开了所有对手不止一个身位。

一季度小米汽车的处境很微妙。老SU7已经停产,交付全靠YU7系列扛着;新一代SU7虽然在3月下旬开启交付后,4月单月卖了26826辆、占当月总销量的73%,但YU7在4月的零售量已从年初巅峰的3.7万辆回落至9876辆。

两款车的此消彼长,像极了青黄不接的过渡期。

打开网易新闻 查看精彩图片

●图注:YU7与Model Y销量对比,八败两胜

但从财报电话会上释放的信号来看,雷军并不慌张。

小米CFO林世伟在会上透露,董事会已启动总额不超过200亿港元的股份回购计划,截至披露时小米2026年累计回购已超过80亿港元,回购力度位居港股第二。

真金白银回购股票,确实比任何口头表态都更有说服力。更何况小米汽车的毛利率一季度达到了20.1%,放在整车行业已经是一个相当拿得出手的工业化起点,单车均价23.5万元也在行业中处于第一梯队。

管理层在电话会上坦言,亏损主要来自跨年订单的购置税补贴、SU7 Ultra高端车型交付占比下降、以及核心零部件价格上涨的三重叠加,属于阶段性因素而非结构性问题。

打开网易新闻 查看精彩图片

价格战打到头,然后呢

随着DeepSeek和小米前后降价,一个清晰的信号浮出了水面:大模型API正在从高毛利的收费入口,变成基础设施级别的水电煤。

梁文锋此前说过一句话,公司的定价哲学很简单:核算成本后定价,不贴钱,也不赚暴利,AI应该是普惠的、人人用得起的。

此次小米的降价幅度比DeepSeek更猛,背后是同样的逻辑:技术的价值,最终要体现在被使用的广度上。

降价不意味着不赚钱。当调用成本降到足够低,下游的应用生态才会真正爆发。

Agent开发、代码辅助、智能客服、语音交互......这些场景的商业化,靠的不是高价卖Token,而是海量调用带来的规模效应。

小米的算盘很清楚:用降价把开发者拉进自己的生态,用生态的繁荣反哺模型迭代,再用模型能力的领先守住定价的话语权。

而相比于雷军的豪赌最终能否让小米在AI时代站稳脚跟开发者们可能更关心下一个降价的会是谁。

*编排 | 黄家俊 审核 | 黄家俊

行业资讯、案例资料、运营干货,精彩不停

打开网易新闻 查看精彩图片

2000万品牌经理人内参!

聚焦头部与标杆,助力品牌高端化。

品牌专访微信:jiangnan254(备注:专访)

百万品牌经理人都在看

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片