面壁智能，大模型“另类”生存法则|大模型|生存法则|算法|面壁智能

撰文| 郝鑫

编辑| 吴先之

面壁智能，是中国大模型行业中的“另类”。

在国内外大肆流行Scaling Law（规模定律），即奉行参数越大、数据越多、算力越强，模型能力就越强的时候。

面壁智能则反其道行之，遵循“知识密度”，即用更少的参数实现更强的能力；以及“密度法则”，即在有限算力下，持续提升模型能力密度。

一个是“大力出奇迹”，一个是“以小博大”，这注定一开始面壁就与主流的“AI六小龙”走上了不同的道路。

有趣的是，面壁智能与“AI六小龙”的命运，在无形中形成了一个大写的“X”。交汇点是大模型洗牌期，早期风头无两的零一万物和百川智能，出现了明显掉队的迹象，智谱、MiniMax成功“上岸”，月之暗面和阶跃星辰只差临门一脚。

在这过程中，面壁智能的处境可以用“夹缝生存”和“逆流而上”来形容。没有打在身上的聚光灯、没有超高金额的融资，面壁智能咬紧“端侧”方向，接连躲过了算力战、价格战和C端流量战。

保存实力的打法，不仅让面壁智能活了下来，而且也成为了一股不可忽视的力量。

自2023年4月至今，约三年时间，面壁智能完成了7轮融资，几乎每半年一轮，频率高于多数同期创业公司。

经过多轮融资后，截至今年4月最近的新一轮融资，面壁智能正式迈入大模型独角兽门槛（10亿美元级别），位列当前中国大模型第二梯队前列。

“错位”的市场预期

2023年，Agent对大多数人来说，仍是一个模糊的概念，构成其认知的主要来源来自于学术论文。那一年，关于Agent最热门的话题是“斯坦福小镇”。

当时，行业对Agent认知到什么程度呢？一个例子或许能说明些问题，有归国的创业者在小型论坛上介绍其Agent创业项目，至少得花一个小时的时间科普Agent的概念，只因为太过于抽象。

就是在这样的环境下，面壁智能在2023年末，一口气发布了AI智能体应用框架“XAgent”、智能体通用平台“AgentVerse”、多智能体协作开发框架“ChatDev”以及一款AI开发软件。

在对媒体的闭门交流会上，面壁智能也不得不以，大家更为熟悉的“Copilot”“SaaS”等概念，来解释Agent。以现在的眼光来看，当时面壁智能已经有了Vibe Coding的想法。

面壁智能相关负责人告诉光子星球，他们判断，“AI Agent是大模型落地场景的重要路径，未来会是Agent的世界，万物都是Agent”。

电饭锅可以是Agent，放入食材后，根据熬粥的逻辑，自动加热；冰箱也是Agent，如果出现冷却剂故障情况，会通过对话提醒，待确认后预约维修师傅上门。

电饭锅和冰箱的比喻，核心不是让家电“会说话”，而是赋予它们自主感知、自主决策、自主执行的主体地位。

这也为后面押注端侧埋下了伏笔，因为“万物Agent”与“硬件端侧”，是灵魂与肉体的关系。没有端侧模型这个肉体，Agent的灵魂只能是游荡在云端，无法干预物理世界的幽灵。没有Agent这个灵魂，端侧模型就只是一个更小的模型文件，缺乏明确的应用指向。

理想很丰满，现实却很骨感。时间线拉回到2023年，百度文心、阿里通义、腾讯混元大模型在上半年才刚刚发布，下半年月之暗面的Kimi助手也才刚开启内测。

2024年初，面壁智能开始把重心转移到端侧上，以小钢炮MiniCPM拉开了序幕。用面壁智能CEO李大海的话来说，“以小博大”“以大博聚”构成了面壁智能的核心能力。其核心要义就是要用最少的资源、最小的规模达到最佳的性能。

截至目前，MiniCPM模型已经更新到了3.0系列，模型参数始终控制在10B以下，且逐步从通用语言模型扩展至多模态、全模态和垂直场景专用模型。

大模型和小模型是一组相对的概念，如果把“AI六小龙”的战场视为大模型，那面壁智能的主战场始终就在“小模型”上。

有AI创业者认为，比起参数规模超大的模型，规模在几十亿到百亿的中小模型，更具实用价值。“开源百亿参数的模型，便利中小企业，几十亿规模的模型，几乎开发者都能上手”。而国内模型生态，最缺乏的就是中小模型这块“拼图”。

两者各有所长，在需要复杂知识推理、长文档分析、专业内容生成的生产力或创作场景中，“AI六小龙”的云端模型不可或缺。但在需要实时交互、隐私保护、稳定可靠的汽车、手机、IoT设备中，面壁的端侧模型则更有优势。

两者共同构成了，“云端训练大脑，端侧执行小脑”的完整AI产业拼图。

避开正面战场

巨头下场，加快了大模型行业的洗牌速度。“AI六小龙”被迫卷进了地狱级的消耗战。

面壁智能不仅没有被这波浪潮拍打到，反而因为浪潮拍打了别人，凸显了自身的价值。

不碰千亿、万亿参数模型，相当于主动放弃进入算力黑洞的入场券。其模型运行在客户的手机、汽车和终端芯片上，根本不走云端API计费，因此避免了陷入价格战的漩涡。不做需要日活、月活、留存率的超级APP，既不用花费高昂的市场营销费用，又避开了与互联网大厂的流量碾压战。

以面壁智能为代表的端侧模型厂商，直击了企业的数据隐私痛点，这成为其核心竞争力之一。对企业而言，涉及关键性和敏感性的数据，不可能直接喂给大模型，特别是大型国有企业。

还有需要及时反馈的场景，端侧模型的作用远大于通用大模型。拿具身智能领域的场景举例，当人形机器人试图跨过路障时，需要其立即判断该路障的高度、硬度以及应对姿势。此时，模型调用不会发生在公有云上，因为有网络延时，而是通过内置蒸馏的本地小模型，完成及时响应。

“AI六小龙”的战场是算力密集型，既谁的GPU多、谁的参数大，谁就有话语权。这是互联网大厂和美元基金的主场。

而面壁智能的逻辑是，端侧战场是能效密集型，即谁能在10亿参数内、50毫秒延迟、100毫瓦功耗的极限约束下，做出接近云端模型的效果，谁就能领跑。这是一个被巨头忽视的技术角落。

选定战场后，面壁智能开始做巨头不愿做的“脏活累活”。

有行业人士告诉我们，“芯片和手机大厂在自研端侧模型或模型时，多数只会针对自身产品做优化，这一点上大家是垂直封闭的。”

面壁智能作为中立的第三方，则可以为所有主流平台提供统一的模型接口和最优适配。对于车企和Tier 1来说，这意味着“一次集成，多平台部署，极大降低了开发成本”。

这一步的核心是用工程苦力构建兼容性壁垒。面壁的护城河不是一行精妙的算法，而是几万行适配代码和对几十种芯片的深刻理解。这种壁垒，巨头不愿意建，小公司建不起。

成立初期，面壁智能就瞄准了B端客户，从最早的金融和营销领域，逐步扩展至现在的汽车、具身智能、教育等领域。

值得一提的是，面壁智能的客户多来自于被巨头挤压，但又不想完全依附于巨头的二线玩家。这里面有对抗ARM、英特尔生态，需要独立AI软件栈的龙芯；不愿被华为、小米等智能座舱生态绑定的保时捷；在AI云服务上不想完全依赖于阿里等大厂的中国电信等。

以上提到的客户名字，均出现在了面壁智能B轮到C轮的融资名单中。通过股权与业务绑定，面壁智能试图把自己变成了硬件产品的一个组件。

这意味着，只要搭载面壁模型的汽车、手机在出货，它就有持续收入。这就像英伟达的显卡驱动，用户感觉不到，但不可或缺。

另外，面壁智能还在开拓信创领域。在泛司法、政务、金融等场景，数据不出终端是法律红线。面壁智能的端侧私有化部署能力，使其成为这些领域的合法选项。这不是技术竞争，是合规准入竞争。

等风来

技术创新扩散理论提到，一项技术从实验室到产业化中间，存在“概念先行，条件滞后”的经典时间差。

面壁智能在Agent方面的主张恰好印证了上述观点。2023年的Agent，更像是面壁智能的超前技术宣言，向外界展示了目的地，但缺少了通往终点的路和车。

2023年的Agent土壤面临着先天性不足，彼时最强的开源模型是LLaMA 2，闭源模型是GPT-3.5/GPT-4初代。这些模型虽然在生成文本上惊艳，但在逻辑规划、任务拆解、工具调用、长程记忆这四个Agent核心能力上极不稳定。当时的Agent是“玩具”，不是“工具”。

彼时，大多数企业还在消化“什么是大模型”。而面壁智能提出的“一句话开发软件”和“多智能体协作”，对应的是高度数字化、流程标准化的理想组织。当时绝大多数企业的数字化基座根本不支持Agent去执行操作。Agent反倒成了空中楼阁。

现在的面壁智能，能被关注是因为它主动放弃了以Agent为卖点，转而把Agent能力压缩进了端侧模型的“地基”里。

2026年初，“龙虾”OpenClaw在全球爆发，成为了面壁智能等待的一股东风。

OpenClaw让市场第一次直观感受到，AI能动手干活了。但用户很快发现，云端Agent存在隐私裸奔、网络依赖、成本高昂三大痛点。

市场自然产生了一个追问，有没有一种Agent，能断网运行、数据本地处理、还不按次收费？这个问题的标准答案，恰好指向面壁智能深耕三年的端侧Agent方案。

行业中有专家就指出，未来发展的方向就是端云协同。

云端大脑利用其强大的全局规划和复杂推理能力，负责长程任务的战略分解、意图理解和最终结果的校验；端侧是手脚，利用其低延迟、高隐私、低成本的特性，在手机、PC、汽车等设备上，负责执行被拆解好的、具体的、短周期的子任务。

即使这样，面壁智能的头上依然笼罩着估值的阴影。面壁的估值绝对数值并不低，但与六小龙中靠前的几家相比，确实存在明显估值差。

大模型和端侧模型的想象力固然有差别，但面壁智能所面临的核心问题最终都要归结于：到底是硬件定义软件，还是软件定义硬件？

面壁智能的端侧模型，在市场上逃不开高通、华为、苹果这些厂商，它们都有自研端侧AI能力，且拥有底层的芯片控制权。关于未来的担忧是，面壁智能是否会重走当年输入法的老路，最终被手机厂商自研方案替代或边缘化。

这种“被包饺子”的风险，会压制其长期估值倍数。

面壁智能必须不断证明，自己的算法优势能持续领先芯片厂的内部团队一代以上，才能消除这一折价。

微信号｜TMTweb

公众号｜光子星球

别忘了扫码关注我们！

面壁智能，大模型“另类”生存法则

热搜

热门跟贴

热搜

热门跟贴

相关推荐

上半年产量突破4万台，人形机器人仍“缺数据”！四维图新孟庆昕：我们希望把数据真正做成可流通、可复用的资产

面壁智能开源全模态模型MiniCPM-o4.5，边看边听还能主动抢答

WAIC 2026现场 | 一句话完成洞察 蜜度首发DataQ数据分析与洞察智能体

36氪首发 | 港科大博士创业做机器人全身触觉系统，红杉、瓴智、智元共同押注

“AI领域最被滥用的术语”李飞飞终于把世界模型讲明白了

IDC报告：中国AI Coding市占率阿里Qoder断层第一，超过二三四五名总和

亦庄机器人马拉松现场名场面合集

大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

直击WAIC丨MiniMax展台曝光新一代多模态生成模型H3 内部人士称“很快会上”

荒野求生（机器狗全自主版），2025ATEC挑战真实户外无遥操

星流AI实测！从形象到周边一键生成，手残党狂喜

影目科技刘宇：以APEC为窗，递出“成都造”智能产品的“实用名片”

AI Agent是科技革命中的一次真正的范式转移

大模型的魅力在于突发涌现的能力

397B参数追平万亿模型，上海AI Lab发布科学智能体新基座 | WAIC 2026

独家对话｜百度沈抖：拿什么去拼未来三年窗口期

安心养虾！从OpenClaw 看云上AI安全落地路径

邱锡鹏：未来我们一定会进入泛情境智能时代

Agent输出到底该用谁？ 卡帕西转发：试试让AI输出HTML

Anthropic的AI读心术，让人类读懂大模型在想啥

WAIC 2026现场 | 一句话完成洞察蜜度首发DataQ数据分析与洞察智能体

Agent输出到底该用谁？卡帕西转发：试试让AI输出HTML