全球AI领域的军备竞赛,在2026年的第一个月再次被推向了新的高潮。

1月22日,百度正式发布并上线文心大模型5.0(ERNIE 5.0)。这就像是一个明确的信号:在全球大模型第一梯队的博弈中,中国科技巨头正试图通过技术路径的差异化,从“跟随者”转向“定义者”。

摆在桌面上的数据不仅惊人,而且充满“暴力美学”与精细工程的矛盾统一——2.4万亿参数,这通常意味着巨大的算力消耗;但百度同时交出了“低于3%的激活参数比”这一成绩单。

在与GPT-5-High和Gemini-2.5-Pro等国际顶尖选手的对垒中,文心5.0不仅在40余项权威基准评测中稳居前列,更关键的是,它彻底抛弃了业内惯用的“拼凑式”多模态方案,转而由统一的自回归架构接管一切。

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜在发布现场表示,此次迭代的核心逻辑,“拒绝‘拼接’,告别转译。”

原生全模态,拆掉感知的“巴别塔”

在过去很长一段时间里,全球多模态大模型的主流做法是“后期融合”——用一个视觉编码器看图,用一个音频模型听声,再通过一个大语言模型来统筹。这种做法就像是三个语言不通的人在开会,虽然能合作,但中间存在着巨大的转译损耗。

文心5.0走了一条更难的路。

“文心5.0的技术路线采用了统一的自回归架构进行原生全模态建模。”吴甜解释说,这意味着文本、图像、视频、音频等多源数据在同一个模型框架中进行联合训练。在文心5.0的神经元里,看到一张图片和读到一段文字,不再是两种割裂的信号,而是被统一架构充分融合并协同优化的信息流。

这种“原生”带来的能力跃升是肉眼可见的。在发布会现场的演示中,文心5.0展现了一种近乎直觉的理解力:仅仅输入一段博主复刻“活了么”App的教程视频,模型不仅“看懂”了视频,还自动拆解了步骤,理解了核心交互逻辑,并直接生成了可运行的前端代码。

这已不再是简单的“图生文”或“文生码”,这是对物理世界动态逻辑的深层理解与重构。

为了支撑这套庞大的原生系统,百度采用了超大规模混合专家结构(MoE)。2.4万亿的参数量虽大,但在实际推理中,通过超稀疏激活技术,每次任务仅调动不到3%的参数。这不仅解决了超大模型“算力黑洞”的难题,也让文心5.0在保持顶级智商的同时,具备了极高的推理效率。

应用为王,价值不在模型,而在场景

如果说参数和架构是技术的“里子”,那么应用落地就是商业的“面子”。

经历了过去几年AI行业的喧嚣,市场已经不再为单纯的跑分成绩买单。百度显然深谙此道,文心助手月活突破2亿的数据背后,是百度对“模型即应用”这一误区的修正。

打开网易新闻 查看精彩图片

“应用模型的价值不在模型里,而在应用里。”百度应用模型研发部负责人贾磊直接点破了当前AI行业的迷局。他强调,百度的目标是让模型在真实应用场景里“跑得稳、答得对、用得起”。

为了实现这一目标,百度构建了一套精密的分层模型体系:

矩阵模型:面向通用场景,如文心Lite、视频大模型、语音大模型,主打快速落地。

专精模型:面向垂直行业,如搜索闪电专精模型、电商蒸汽机模型。

现场演示的“创意写作”环节,展示了文心5.0对中国本土语境的极致掌控。模型被要求模拟《红楼梦》中王熙凤的口吻,撰写一份“大观园资产重组方案”。结果,生成的文本既保留了“凤辣子”精明干练、泼辣犀利的古典韵味,又天衣无缝地融合了现代商业逻辑。这种对文化细微差别的拿捏,正是国产大模型在本土商业场景中的核心护城河。

此外,贾磊分享的“三态Token联动架构”数字人技术,更是对直播电商行业的一次降维打击。通过突破传统的文本、语音、视频串联模式,百度实现了对数字人的流式控制。这意味着,未来的带货主播可能不再是真人,而是由声音Token实时驱动表情与口型、5分钟即可复刻超越真人的“超级个体”。2025年罗永浩数字人直播打破行业记录,正是这一技术商业潜力的冰山一角。

Agent Infra,构建AI时代的操作系统

但在百度的棋局中,单一的模型或应用并非终局。真正的野心,在于生态。

百度千帆平台产品负责人张婷在“文心Moment”大会上展示了百度的底牌——Agent Infra(智能体基础设施)。

打开网易新闻 查看精彩图片

全球AI行业正在从Chatbot(聊天机器人)向Agent(智能体)演进。Chatbot只能陪你聊天,而Agent能帮你做事。但开发Agent的门槛极高,需要复杂的工具链和稳定的运行环境。

百度利用其独有的“芯云模体”全栈自研架构,打通了从昆仑芯片、百度智能云到文心大模型、再到智能体应用的全链路。千帆平台集成了包括百度AI搜索在内的众多工具及MCP工具链,为企业提供了一个“全周期、稳定支持多场景业务”的Agent开发底座。

数据证明了这一策略的有效性:目前,千帆平台上已累计开发超130万个Agents,以“百度AI搜索”为代表的工具日均调用量突破千万次。当其他公司还在兜售API时,百度正在成为AI时代的“操作系统”提供商。

校准与对齐,给AI立“规矩”

值得注意的是,在追求技术极速狂奔的同时,百度并未忽视AI的安全与价值观对齐。吴甜介绍了“文心导师”计划的最新进展。目前,已有835位来自数理化生文史哲等学科及金融、医疗等行业的专家加入这一计划。他们的角色类似于AI的“人类老师”,在知识传授、鉴赏评价、专业校准方面对大模型进行指导。

这一举措至关重要。文心5.0不仅要“聪明”,还要“正确”。在逻辑严谨性、专业深度和价值观对齐上的精进,是文心5.0能够进入严肃商业和教育领域的通行证。

LMArena全球大模型竞技场的榜单是残酷且客观的。2025年11月Preview版本上线以来,文心5.0多次位居文本榜和视觉理解榜国内第一,跻身国际第一梯队。1月15日数据显示,其以1460分位列全球第八,超越了GPT-5.1-High等强劲对手。文心5.0的正式发布,标志着原生全模态技术路线的成熟。这不仅是百度的一场技术胜利,更体现了中国模型厂商在底层架构上的自主创新能力。

在这个被算力、数据和算法重塑的时代,百度正试图用2.4万亿参数的宏大叙事,讲述一个关于“连接”的故事:连接文本与视频,连接模型与场景,连接现在与未来。