超越GPT-5？百度文心5.0炸场发布，登顶全球数学榜|gpt|模态|王熙凤|百度文心|知名企业

2026年1月22日，百度于上海召开“文心Moment”大会，正式发布并上线原生全模态大模型“文心5.0正式版”。据多家媒体报道，该模型基于原生全模态统一建模技术，拥有高达2.4万亿参数，具备对文本、图像、音频、视频等多种信息的统一理解与生成能力。目前，个人用户可通过文心APP、文心一言官网体验，企业与开发者则可基于百度千帆平台进行调用，百度旗下的慧播星、文心助手等产品也已全面接入。

在多项权威评测中，文心5.0展现了国际一流的竞争力。在40余项权威基准的综合评估中，其语言与多模态理解能力超越了Gemini-2.5-Pro、GPT-5-High等国际主流模型。特别是在广受关注的LMArena全球大模型竞技场榜单中，文心5.0以1460分位列文本榜国内第一、全球第八，其数学能力更是位居全球榜首，视觉理解能力也跻身全球前列，成为该榜单中表现优异的中国模型。

百度集团副总裁吴甜在会上详细阐释了文心5.0的核心技术路径。与业界常见的“后期融合”方案不同，文心5.0采用统一的自回归架构进行原生全模态建模，将多源数据在同一框架中联合训练，实现了多模态特征的原生深度融合与协同优化。在模型结构上，它采用了超大规模混合专家（MoE）架构，并以低于3%的超稀疏激活参数比例，在保持强大能力的同时显著提升了推理效率。此外，通过基于思维链和行动链的强化学习训练，模型的智能体与工具调用能力也得到增强。

得益于原生全模态的技术优势，文心5.0在多项实际任务中表现出色。现场演示显示，仅输入一段复刻“活了么”App的教学视频，模型便能自动拆解步骤并生成可运行的前端代码；在创意写作中，它能模仿《红楼梦》王熙凤的语言风格，创作出融合古典与现代商业思维的文案。这些能力体现了其在复杂情境下的深度理解与创造性。吴甜还介绍了“文心导师”计划的进展，目前已有来自科技、金融、文化、教育等十余个重点行业及多个基础学科的835位专家加入，在知识传授、专业校准等方面对模型进行持续指导。

有分析文章指出，文心5.0的发布标志着原生全模态技术路线走向成熟与实用，展现了中国AI厂商在底层技术上的自主创新能力。该分析将百度的策略与谷歌的体系化AI路线相类比，认为百度长期坚持的“芯-云-模-体”全栈自研体系——涵盖自研AI芯片（昆仑芯）、智能云、大模型及各类智能体应用——虽看似“更重更慢”，却能在AI工业化阶段构建深厚的生态壁垒，是赢得长期竞争的关键。百度在2025年股价的显著上涨，也部分反映了市场对其长期技术路线的认可。

在会后的实际测试中，文心5.0也展现了多方面的应用潜力。例如，在视频理解任务中，它能精确到秒地分析一段旅行视频的节奏变化、镜头切换与叙事结构，显示出原生多模态理解的深度。在创意写作测试中，它能生成技术细节准确、情感层次丰富的短篇故事。更值得一提的是，在理解中文特定语境（如分析相亲简历中的潜台词）或构思高情商回复等涉及“人情世故”的任务中，模型展现出了对中文社会文化语境的深刻洞察，这成为其区别于许多国际模型的一个显著亮点。