撰文| 郝 鑫

编辑| 吴先之

面壁智能,是中国大模型行业中的“另类”。

在国内外大肆流行Scaling Law(规模定律),即奉行参数越大、数据越多、算力越强,模型能力就越强的时候。

面壁智能则反其道行之,遵循“知识密度”,即用更少的参数实现更强的能力;以及“密度法则”,即在有限算力下,持续提升模型能力密度。

一个是“大力出奇迹”,一个是“以小博大”,这注定一开始面壁就与主流的“AI六小龙”走上了不同的道路。

有趣的是,面壁智能与“AI六小龙”的命运,在无形中形成了一个大写的“X”。交汇点是大模型洗牌期,早期风头无两的零一万物和百川智能,出现了明显掉队的迹象,智谱、MiniMax成功“上岸”,月之暗面和阶跃星辰只差临门一脚。

打开网易新闻 查看精彩图片

在这过程中,面壁智能的处境可以用“夹缝生存”和“逆流而上”来形容。没有打在身上的聚光灯、没有超高金额的融资,面壁智能咬紧“端侧”方向,接连躲过了算力战、价格战和C端流量战。

保存实力的打法,不仅让面壁智能活了下来,而且也成为了一股不可忽视的力量。

自2023年4月至今,约三年时间,面壁智能完成了7轮融资,几乎每半年一轮,频率高于多数同期创业公司。

经过多轮融资后,截至今年4月最近的新一轮融资,面壁智能正式迈入大模型独角兽门槛(10亿美元级别),位列当前中国大模型第二梯队前列。

“错位”的市场预期

2023年,Agent对大多数人来说,仍是一个模糊的概念,构成其认知的主要来源来自于学术论文。那一年,关于Agent最热门的话题是“斯坦福小镇”。

当时,行业对Agent认知到什么程度呢?一个例子或许能说明些问题,有归国的创业者在小型论坛上介绍其Agent创业项目,至少得花一个小时的时间科普Agent的概念,只因为太过于抽象。

就是在这样的环境下,面壁智能在2023年末,一口气发布了AI智能体应用框架“XAgent”、智能体通用平台“AgentVerse”、多智能体协作开发框架“ChatDev”以及一款AI开发软件。

在对媒体的闭门交流会上,面壁智能也不得不以,大家更为熟悉的“Copilot”“SaaS”等概念,来解释Agent。以现在的眼光来看,当时面壁智能已经有了Vibe Coding的想法。

面壁智能相关负责人告诉光子星球,他们判断,“AI Agent是大模型落地场景的重要路径,未来会是Agent的世界,万物都是Agent”。

电饭锅可以是Agent,放入食材后,根据熬粥的逻辑,自动加热;冰箱也是Agent,如果出现冷却剂故障情况,会通过对话提醒,待确认后预约维修师傅上门。

电饭锅和冰箱的比喻,核心不是让家电“会说话”,而是赋予它们自主感知、自主决策、自主执行的主体地位。

这也为后面押注端侧埋下了伏笔,因为“万物Agent”与“硬件端侧”,是灵魂与肉体的关系。没有端侧模型这个肉体,Agent的灵魂只能是游荡在云端,无法干预物理世界的幽灵。没有Agent这个灵魂,端侧模型就只是一个更小的模型文件,缺乏明确的应用指向。

理想很丰满,现实却很骨感。时间线拉回到2023年,百度文心、阿里通义、腾讯混元大模型在上半年才刚刚发布,下半年月之暗面的Kimi助手也才刚开启内测。

2024年初,面壁智能开始把重心转移到端侧上,以小钢炮MiniCPM拉开了序幕。用面壁智能CEO李大海的话来说,“以小博大”“以大博聚”构成了面壁智能的核心能力。其核心要义就是要用最少的资源、最小的规模达到最佳的性能。

打开网易新闻 查看精彩图片

截至目前,MiniCPM模型已经更新到了3.0系列,模型参数始终控制在10B以下,且逐步从通用语言模型扩展至多模态、全模态和垂直场景专用模型。

大模型和小模型是一组相对的概念,如果把“AI六小龙”的战场视为大模型,那面壁智能的主战场始终就在“小模型”上。

有AI创业者认为,比起参数规模超大的模型,规模在几十亿到百亿的中小模型,更具实用价值。“开源百亿参数的模型,便利中小企业,几十亿规模的模型,几乎开发者都能上手”。而国内模型生态,最缺乏的就是中小模型这块“拼图”。

两者各有所长,在需要复杂知识推理、长文档分析、专业内容生成的生产力或创作场景中,“AI六小龙”的云端模型不可或缺。但在需要实时交互、隐私保护、稳定可靠的汽车、手机、IoT设备中,面壁的端侧模型则更有优势。

两者共同构成了,“云端训练大脑,端侧执行小脑”的完整AI产业拼图。

避开正面战场

巨头下场,加快了大模型行业的洗牌速度。“AI六小龙”被迫卷进了地狱级的消耗战。

面壁智能不仅没有被这波浪潮拍打到,反而因为浪潮拍打了别人,凸显了自身的价值。

不碰千亿、万亿参数模型,相当于主动放弃进入算力黑洞的入场券。其模型运行在客户的手机、汽车和终端芯片上,根本不走云端API计费,因此避免了陷入价格战的漩涡。不做需要日活、月活、留存率的超级APP,既不用花费高昂的市场营销费用,又避开了与互联网大厂的流量碾压战。

以面壁智能为代表的端侧模型厂商,直击了企业的数据隐私痛点,这成为其核心竞争力之一。对企业而言,涉及关键性和敏感性的数据,不可能直接喂给大模型,特别是大型国有企业。

还有需要及时反馈的场景,端侧模型的作用远大于通用大模型。拿具身智能领域的场景举例,当人形机器人试图跨过路障时,需要其立即判断该路障的高度、硬度以及应对姿势。此时,模型调用不会发生在公有云上,因为有网络延时,而是通过内置蒸馏的本地小模型,完成及时响应。

“AI六小龙”的战场是算力密集型,既谁的GPU多、谁的参数大,谁就有话语权。这是互联网大厂和美元基金的主场。

而面壁智能的逻辑是,端侧战场是能效密集型,即谁能在10亿参数内、50毫秒延迟、100毫瓦功耗的极限约束下,做出接近云端模型的效果,谁就能领跑。这是一个被巨头忽视的技术角落。

选定战场后,面壁智能开始做巨头不愿做的“脏活累活”。

有行业人士告诉我们,“芯片和手机大厂在自研端侧模型或模型时,多数只会针对自身产品做优化,这一点上大家是垂直封闭的。”

面壁智能作为中立的第三方,则可以为所有主流平台提供统一的模型接口和最优适配。对于车企和Tier 1来说,这意味着“一次集成,多平台部署,极大降低了开发成本”。

打开网易新闻 查看精彩图片

这一步的核心是用工程苦力构建兼容性壁垒。面壁的护城河不是一行精妙的算法,而是几万行适配代码和对几十种芯片的深刻理解。这种壁垒,巨头不愿意建,小公司建不起。

成立初期,面壁智能就瞄准了B端客户,从最早的金融和营销领域,逐步扩展至现在的汽车、具身智能、教育等领域。

值得一提的是,面壁智能的客户多来自于被巨头挤压,但又不想完全依附于巨头的二线玩家。这里面有对抗ARM、英特尔生态,需要独立AI软件栈的龙芯;不愿被华为、小米等智能座舱生态绑定的保时捷;在AI云服务上不想完全依赖于阿里等大厂的中国电信等。

以上提到的客户名字,均出现在了面壁智能B轮到C轮的融资名单中。通过股权与业务绑定,面壁智能试图把自己变成了硬件产品的一个组件。

这意味着,只要搭载面壁模型的汽车、手机在出货,它就有持续收入。这就像英伟达的显卡驱动,用户感觉不到,但不可或缺。

另外,面壁智能还在开拓信创领域。在泛司法、政务、金融等场景,数据不出终端是法律红线。面壁智能的端侧私有化部署能力,使其成为这些领域的合法选项。这不是技术竞争,是合规准入竞争。

等风来

技术创新扩散理论提到,一项技术从实验室到产业化中间,存在“概念先行,条件滞后”的经典时间差。

面壁智能在Agent方面的主张恰好印证了上述观点。2023年的Agent,更像是面壁智能的超前技术宣言,向外界展示了目的地,但缺少了通往终点的路和车。

2023年的Agent土壤面临着先天性不足,彼时最强的开源模型是LLaMA 2,闭源模型是GPT-3.5/GPT-4初代。这些模型虽然在生成文本上惊艳,但在逻辑规划、任务拆解、工具调用、长程记忆这四个Agent核心能力上极不稳定。当时的Agent是“玩具”,不是“工具”。

彼时,大多数企业还在消化“什么是大模型”。而面壁智能提出的“一句话开发软件”和“多智能体协作”,对应的是高度数字化、流程标准化的理想组织。当时绝大多数企业的数字化基座根本不支持Agent去执行操作。Agent反倒成了空中楼阁。

现在的面壁智能,能被关注是因为它主动放弃了以Agent为卖点,转而把Agent能力压缩进了端侧模型的“地基”里。

2026年初,“龙虾”OpenClaw在全球爆发,成为了面壁智能等待的一股东风。

打开网易新闻 查看精彩图片

OpenClaw让市场第一次直观感受到,AI能动手干活了。但用户很快发现,云端Agent存在隐私裸奔、网络依赖、成本高昂三大痛点。

市场自然产生了一个追问,有没有一种Agent,能断网运行、数据本地处理、还不按次收费?这个问题的标准答案,恰好指向面壁智能深耕三年的端侧Agent方案。

行业中有专家就指出,未来发展的方向就是端云协同。

云端大脑利用其强大的全局规划和复杂推理能力,负责长程任务的战略分解、意图理解和最终结果的校验;端侧是手脚,利用其低延迟、高隐私、低成本的特性,在手机、PC、汽车等设备上,负责执行被拆解好的、具体的、短周期的子任务。

即使这样,面壁智能的头上依然笼罩着估值的阴影。面壁的估值绝对数值并不低,但与六小龙中靠前的几家相比,确实存在明显估值差。

大模型和端侧模型的想象力固然有差别,但面壁智能所面临的核心问题最终都要归结于:到底是硬件定义软件,还是软件定义硬件?

面壁智能的端侧模型,在市场上逃不开高通、华为、苹果这些厂商,它们都有自研端侧AI能力,且拥有底层的芯片控制权。关于未来的担忧是,面壁智能是否会重走当年输入法的老路,最终被手机厂商自研方案替代或边缘化。

这种“被包饺子”的风险,会压制其长期估值倍数。

面壁智能必须不断证明,自己的算法优势能持续领先芯片厂的内部团队一代以上,才能消除这一折价。

微信号|TMTweb

公众号|光子星球

别忘了扫码关注我们!