几个月前OpenAI创始成员卡帕西放话:“推理模型要变天了!10亿参数就能建优秀认知核心”——当时不少人还觉得是天方夜谭,结果现在,中国团队直接把预言砸在了大家脸上!

小冰之父李笛带着仅成立半年的AI初创公司Nextie,刚推出了行业首个认知模型“新程Alpha”,参数只有4B(40亿),却能比肩第一梯队的GPT-5.4?这波操作,直接把大模型卷参数的歪风给破了!

要知道,现在的大模型动辄千亿万亿参数,卷到飞起,而新程Alpha就像一股清流——但别小看这个轻量级选手,它不仅搞定了大模型算力烧钱的痛,效果还能和GPT-5.4掰手腕。

这下再也不用月底盯着Token账单发愁了,算力成本立省100%,从烧显卡变成交电费,甚至端侧都能跑,手机电脑上直接用,香不香?

为啥这个小模型能以小搏大?和主流知识型推理模型有啥不一样?其实卡帕西早就点透了:知识不等同于智能。

现在的大模型看似知识渊博,能解复杂数学题、写代码,但细节上经常翻车——比如“200元取钱”的逻辑陷阱,或者数strawberry里有几个“r”这种简单题,都能答错。靠死记硬背,模型学不会深度思考,长程任务里错误还会滚雪球。

就像最近亚马逊员工疯狂用AI,公司都不得不关停内部AI排行榜,不是效果不好,是算力烧得太狠,预算扛不住。养龙虾的朋友也吐槽,每月会员额度和钱包打架,扛不住啊!这几乎是今年大厂的普遍写照——模型认知负担越来越重,账单越来越离谱。

认知模型不一样。它剥离了海量事实记忆,只保留思考算法,具备自主思考和规划能力,能把一个场景的思维策略泛化到另一个不相关领域。

比如围棋九段不是靠记棋谱赢,而是懂博弈本质,换赛道打扑克也能拿冠军。新程Alpha就是这样,凝练了认知核心,让模型真正学会思考,举一反三。

基于这个,团队提出了五个评估维度:视角完备性、隐含诉求满足度、辩证深度、落地实操性、决策可解释性。这套方法论让新程Alpha在群体智能任务中,4B参数就能等效GPT-5.4的效果。

而且他们聪明地选择在开源模型上做强化学习,解耦知识与认知,训练目标是强化泛化和抽象能力——4B刚好是黄金尺寸,够承载思考算法,又能端侧部署。

其实他们一直在问同一个问题:智能体如何更好协作?小冰时代解决“一个智能体怎么聊天”,Nextie则升级到“一群智能体怎么聊天”。

比如2023年初推出的“小冰链”,用GPT-3约2%的参数实现透明思维链;年底用3.6B模型击败Meta的65B Llama,登顶日本Hugging Face排行榜——小参数+高质量架构是他们的拿手好戏。

现在Nextie推出团子多Agent平台和新程Alpha,刚好是Harness群体多智能体的一体两面:让AI长脑子(认知模型),也会合作(多Agent平台)。

Harness今年才火起来,OpenAI发报告、投资相关公司,而Nextie早就布局了,连李开复和陆奇都罕见同框押注,成立四个多月就完成两轮融资,资金够未来三到五年创新。

继新程Alpha之后,Nextie的8B认知模型正在加速训练。这意味着什么?AI的进化方向可能真的变了——不再是比谁参数大,而是比谁的认知能力强。

低成本、可泛化、端侧运行的认知模型,能解锁更多场景:比如家庭机器人做家务,以前用大模型根本用不起,现在认知模型把价格打下来,日常场景终于经济可行;比如Agent可以7x24小时主动规划,不用等用户指令,彻底解锁Proactive场景。