斯坦福HAI今天甩出一份423页的「2026年AI指数报告」,像一份体检单——AI的肌肉涨得飞快,但人类衡量和管好它的能力,几乎没长。
最扎眼的数字是:中美顶尖模型在竞技场榜单上的差距,只剩2.7%。换算成分数,美国Claude Opus 4.6拿1503分,中国dola-seed-2.0-preview拿1464分,差距39分。过去一年,两国头部模型你来我往换了好几次位置,像乒乓球赛。
但这份报告最让中文读者沉默的,可能是另一组数字:22到25岁的软件开发者,从2024年至今就业人数下滑约20%。同期年纪更大的同行反而在增长。不是宏观失业,是入口岗位被精准切掉——第一份工作没了,职业阶梯直接断一格。
AI的能力分布像一块凹凸不平的木板。Gemini能拿国际数学奥赛金牌,PhD级科学问答、竞赛数学、多模态推理这些「人类不可超越」的硬骨头全被啃下。但同一块木板的另一头,最强模型读模拟时钟的正确率是50.1%——比抛硬币强不了多少。
研究者管这叫「锯齿前沿」。机器人在实验室仿真环境里操作成功率89.4%,搬到真实家庭场景洗碗叠衣服,掉到12%。能修Bug的Agent在真实终端任务里从20%涨到77.3%,但让AI独立完成科研逻辑测试,得分仅39%,只有博士生一半功力。
企业不管这些凹凸。全球企业AI采用率已达88%,九成的公司已经把AI接进某个工作流。2025年全球企业AI投资5817亿美元,同比翻倍。美国一国吃下近一半私募投资,但招揽顶尖人才却越来越吃力——进入美国的AI研究人员7年跌89%,仅过去一年就跌80%。
钱和人这两条曲线开始反向,这是过去十年没出现过的局面。
算力曲线跑得更疯。全球AI算力三年涨30倍,英伟达独占60%以上,而几乎所有芯片都出自台积电一家。命门越窄,焦虑越重。xAI Grok 4一次训练的碳排放相当于17000辆汽车开一整年,数据中心建在哪、电从哪来、芯片从哪产,变成所有AI公司CEO案头最头疼的事。
开源生态的重心明显东移。DeepSeek、Qwen、GLM、MiniMax、Kimi把开源权重的能力曲线往前推。海外开发者算过账,Seed 2.0 Pro输出价格大约只有Claude Opus 4.6的十分之一。性能贴脸,价格十分之一,连锁反应才刚刚开始。
去年发布的95个最具代表性模型里,80个没有公开训练代码。透明度指数从58分跌到40分,谷歌、Anthropic、OpenAI都已放弃公开最新模型的训练数据规模。最强模型越来越黑箱,公众对AI感到紧张的比例从50%上升到52%——和认为AI利大于弊的比例同时增长。
最分裂的是美国。只有33%的美国人认为AI会让自己的工作变得更好,全球平均40%。美国人对本国政府监管AI的信任度,31%,受访国家里最低。最近Sam Altman家被袭击后,硅谷圈内人「惊讶地发现」Instagram评论区里的普通人并不同情。
423页报告画了一张图:横轴时间,纵轴能力。模型能力在飞,算力在飞,投资在飞,采用率在飞。其他全在原地踏步或向下。
如果你是这个行业里的人,现在该问的不是「未来会怎样」,而是自己站在哪一条曲线上。一位受访高管的预期是:未来的裁员幅度,会比过去几个月还要大。
热门跟贴