2月4日,来自北京的端侧AI模型公司面壁智能开源了仅有9B,但高密度、全模态且拥有“全双工交互”的新模型 MiniCPM-o 4.5。在毗邻清华大学南校门的面壁智能公司总部,围绕模型研发、端侧模型未来的可能性以及面壁智能作为AI初创公司的发展战略,新京报贝壳财经记者采访了面壁智能CEO李大海、面壁智能首席科学家刘知远、面壁智能联合创始人兼COO雷升涛,以及该模型的主要研发者,面壁智能多模态首席科学家姚远。
李大海告诉贝壳财经记者,一直秉承“密度法则”(Densing Law,由刘知远提出,其认为模型的能力密度每100天就可倍增一次),不断将大模型的能力压缩至极致的面壁智能要做“大模型的光刻机”。而经历范式提升后,拥有新能力的MiniCPM模型也有望在具身智能领域“大放异彩”。
而刘知远则把目光看向了未来,在他看来,随着模型能力的提升,端侧模型有望陪伴人类成长,最终每个人都会有专属于自己的模型,让电影中的“贾维斯”成为现实。
清华大学计算机系长聘教授、面壁智能联合创始人兼首席科学家刘知远。新京报贝壳财经记者罗亦丹/摄
首创原生全双工技术,仅有9B却有望成为“具身大脑”
相比其他的大模型公司,面壁智能团队在创业初期就选择了一条非比寻常的道路:做“小而精悍”,可在本地运行的端侧模型。这次发布的MiniCPM-o 4.5,其参数量为9B(记者注:1B代表10亿参数),对比DeepSeek-R1的671B,以及通义千问Qwen3的235B,可以发现面壁智能的这款新模型仅分别为前两者的1.34%和3.83%。
麻雀虽小,五脏俱全。姚远介绍,该模型的能力覆盖全模态、视觉理解、文档解析、语音理解和生成、声音克隆等方方面面,还拥有“边看、边听、主动说”的全双工与主动交互能力,这意味着其自身可以根据环境的动态变化实时反应,以最合适的时机、最恰当的内容回复,让大模型对于信息的感知与传递不会慢半拍。
姚远对贝壳财经记者解释道,传统的单工模型犹如对讲机,当模型回答时,无法接收外部信息,“你很难想象一个人在说话的时候耳朵是堵住的,听的时候又不能说话,而全双工模型在语音方面就解决了这一问题。”谈到具体表现,姚远称,考虑到模型主动“打断”用户有可能会影响交互体验,面壁实际上并没有展示语音维度的能力,但在视觉上,全双工模型可以根据看到的景色变化主动判断交互的时机,输入输出的多模态信息流互不阻塞,对话的延迟更低。
“我们在做这个模型时将其视为全模态基础模型看待,我们相信,全模态在未来赋能终端上有非常大的潜力,无论是汽车、手机还是机器人。有了这样一个能够全双工感知环境并回应用户的模型,将可以把我们现在的设备从被动响应变为主动式智能,所以这是一个范式提升,未来一定能衍生出很多场景。”李大海表示。
对于MiniCPM-o 4.5的应用前景,面壁智能在官方公众号中这样写道:具备类人感知与交互能力、再加上只有 9B 的“小身材”,意味着像具身机器人、汽车、PC 等不同终端交互模式都将进化。以具身机器人为例,目前具身厂商是以研发运控、VLA 模型为主,但行业一直缺乏“理解、沟通、交互”的能力,而像 MiniCPM-o 4.5 则有望补齐具身机器人大脑能力,变得更加智能。
李大海在接受贝壳财经记者采访时表示,在具身智能领域,目前本体的发展比大脑更快,相信具身智能大脑的突破能够为行业带来突飞猛进的进展。姚远也表示,多模态大模型“一定是具身智能实现通用性的最大机会”。
坚持密度法则,面壁智能要做“大模型的光刻机”
此外,对于面壁智能作为初创公司,如何与国内外大厂“差异化竞争”的问题,李大海与雷升涛也回应了贝壳财经记者。
李大海首先提到了面壁智能一直秉承的“密度法则”。他表示,这一定律引发的推论是每一个领先大模型的“保鲜期”都非常短,所以任何大模型公司都需要持续不断进行研发,否则就会被淘汰。
“面壁智能要做‘大模型的光刻机’,在技术层面,我们会不断训练出更高知识密度的大模型。同时,我们也会同步构建其他优势,积极商业化,目前我们的端侧模型在汽车、手机等很多终端设备上运转,交出了还算不错的答卷。”李大海说。
雷升涛则补充道,当前让底层的infra(注:基础设施)模型在端侧跑到极致,是一件非常难的事情。他举例称,“比如车载AI的遗留物品提醒功能,我们最开始做出来时是4秒,客户认为4秒钟‘人就已经走出十来步了’,希望我们做到2秒以内,而最终我们把这个功能做到了1秒之内,这一体验就非常极致。端侧模型意味着算力小、内存小,有着极致的约束,我们把infra这一块做到极致,就能拉长模型领先的时间。”
而对于未来,AI的发展将走向何方,刘知远认为有两大“主旋律”。
在他看来,其一是智能能力越来越强,智能使用越来越高效,“在过去五六年的时间里,我们见证了模型从海量数据中学习知识、理解用户意图、深度思考,接下来这一两年,我们将快速见证模型的专业能力越来越强,跟世界的交互越来越强。当智能体具备了在相关领域进行自主探索、学习成长的能力后,下一步的大突破将是多智能体的协同,完成任何一个个体都无法完成的工作,这也是面壁智能团队将持续发展的方向。”
另一个方面则是“密度法则”,刘知远表示,未来大模型将像芯片一样,不断提高密度,极致地降低模型使用成本与模型尺寸,这样就可以将模型放入终端,更好地服务用户。
“我们可以预见,在未来三到五年的时间里,会有越来越多的终端具备更强智能,当个人的模型也具备了自主学习能力和协同能力时,就会形成一个重要的奇点:这个世界上每个人都会有专属于自己的,持续成长的模型,成为每个人越来越贴心的、懂你的助手。”刘知远说。
记者联系邮箱:luoyidan@xjbnews.com
新京报首席记者 罗亦丹
编辑 岳彩周
校对 付春愔
热门跟贴