仅4B大小可端侧部署！卡帕西预言的「认知模型」被国产做出来了

秋巷雨潇潇

2026-06-12 23:08 ·四川

几个月前OpenAI创始成员卡帕西放话：“推理模型要变天了！10亿参数就能建优秀认知核心”——当时不少人还觉得是天方夜谭，结果现在，中国团队直接把预言砸在了大家脸上！

小冰之父李笛带着仅成立半年的AI初创公司Nextie，刚推出了行业首个认知模型“新程Alpha”，参数只有4B（40亿），却能比肩第一梯队的GPT-5.4？这波操作，直接把大模型卷参数的歪风给破了！

要知道，现在的大模型动辄千亿万亿参数，卷到飞起，而新程Alpha就像一股清流——但别小看这个轻量级选手，它不仅搞定了大模型算力烧钱的痛，效果还能和GPT-5.4掰手腕。

这下再也不用月底盯着Token账单发愁了，算力成本立省100%，从烧显卡变成交电费，甚至端侧都能跑，手机电脑上直接用，香不香？

为啥这个小模型能以小搏大？和主流知识型推理模型有啥不一样？其实卡帕西早就点透了：知识不等同于智能。

现在的大模型看似知识渊博，能解复杂数学题、写代码，但细节上经常翻车——比如“200元取钱”的逻辑陷阱，或者数strawberry里有几个“r”这种简单题，都能答错。靠死记硬背，模型学不会深度思考，长程任务里错误还会滚雪球。

就像最近亚马逊员工疯狂用AI，公司都不得不关停内部AI排行榜，不是效果不好，是算力烧得太狠，预算扛不住。养龙虾的朋友也吐槽，每月会员额度和钱包打架，扛不住啊！这几乎是今年大厂的普遍写照——模型认知负担越来越重，账单越来越离谱。

而认知模型不一样。它剥离了海量事实记忆，只保留思考算法，具备自主思考和规划能力，能把一个场景的思维策略泛化到另一个不相关领域。

比如围棋九段不是靠记棋谱赢，而是懂博弈本质，换赛道打扑克也能拿冠军。新程Alpha就是这样，凝练了认知核心，让模型真正学会思考，举一反三。

基于这个，团队提出了五个评估维度：视角完备性、隐含诉求满足度、辩证深度、落地实操性、决策可解释性。这套方法论让新程Alpha在群体智能任务中，4B参数就能等效GPT-5.4的效果。

而且他们聪明地选择在开源模型上做强化学习，解耦知识与认知，训练目标是强化泛化和抽象能力——4B刚好是黄金尺寸，够承载思考算法，又能端侧部署。

其实他们一直在问同一个问题：智能体如何更好协作？小冰时代解决“一个智能体怎么聊天”，Nextie则升级到“一群智能体怎么聊天”。

比如2023年初推出的“小冰链”，用GPT-3约2%的参数实现透明思维链；年底用3.6B模型击败Meta的65B Llama，登顶日本Hugging Face排行榜——小参数+高质量架构是他们的拿手好戏。

现在Nextie推出团子多Agent平台和新程Alpha，刚好是Harness群体多智能体的一体两面：让AI长脑子（认知模型），也会合作（多Agent平台）。

Harness今年才火起来，OpenAI发报告、投资相关公司，而Nextie早就布局了，连李开复和陆奇都罕见同框押注，成立四个多月就完成两轮融资，资金够未来三到五年创新。

继新程Alpha之后，Nextie的8B认知模型正在加速训练。这意味着什么？AI的进化方向可能真的变了——不再是比谁参数大，而是比谁的认知能力强。

低成本、可泛化、端侧运行的认知模型，能解锁更多场景：比如家庭机器人做家务，以前用大模型根本用不起，现在认知模型把价格打下来，日常场景终于经济可行；比如Agent可以7x24小时主动规划，不用等用户指令，彻底解锁Proactive场景。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴