2026年1月22日,百度于上海召开“文心Moment”大会,正式发布并上线原生全模态大模型“文心5.0正式版”。据多家媒体报道,该模型基于原生全模态统一建模技术,拥有高达2.4万亿参数,具备对文本、图像、音频、视频等多种信息的统一理解与生成能力。目前,个人用户可通过文心APP、文心一言官网体验,企业与开发者则可基于百度千帆平台进行调用,百度旗下的慧播星、文心助手等产品也已全面接入。
在多项权威评测中,文心5.0展现了国际一流的竞争力。在40余项权威基准的综合评估中,其语言与多模态理解能力超越了Gemini-2.5-Pro、GPT-5-High等国际主流模型。特别是在广受关注的LMArena全球大模型竞技场榜单中,文心5.0以1460分位列文本榜国内第一、全球第八,其数学能力更是位居全球榜首,视觉理解能力也跻身全球前列,成为该榜单中表现优异的中国模型。
百度集团副总裁吴甜在会上详细阐释了文心5.0的核心技术路径。与业界常见的“后期融合”方案不同,文心5.0采用统一的自回归架构进行原生全模态建模,将多源数据在同一框架中联合训练,实现了多模态特征的原生深度融合与协同优化。在模型结构上,它采用了超大规模混合专家(MoE)架构,并以低于3%的超稀疏激活参数比例,在保持强大能力的同时显著提升了推理效率。此外,通过基于思维链和行动链的强化学习训练,模型的智能体与工具调用能力也得到增强。
得益于原生全模态的技术优势,文心5.0在多项实际任务中表现出色。现场演示显示,仅输入一段复刻“活了么”App的教学视频,模型便能自动拆解步骤并生成可运行的前端代码;在创意写作中,它能模仿《红楼梦》王熙凤的语言风格,创作出融合古典与现代商业思维的文案。这些能力体现了其在复杂情境下的深度理解与创造性。吴甜还介绍了“文心导师”计划的进展,目前已有来自科技、金融、文化、教育等十余个重点行业及多个基础学科的835位专家加入,在知识传授、专业校准等方面对模型进行持续指导。
有分析文章指出,文心5.0的发布标志着原生全模态技术路线走向成熟与实用,展现了中国AI厂商在底层技术上的自主创新能力。该分析将百度的策略与谷歌的体系化AI路线相类比,认为百度长期坚持的“芯-云-模-体”全栈自研体系——涵盖自研AI芯片(昆仑芯)、智能云、大模型及各类智能体应用——虽看似“更重更慢”,却能在AI工业化阶段构建深厚的生态壁垒,是赢得长期竞争的关键。百度在2025年股价的显著上涨,也部分反映了市场对其长期技术路线的认可。
在会后的实际测试中,文心5.0也展现了多方面的应用潜力。例如,在视频理解任务中,它能精确到秒地分析一段旅行视频的节奏变化、镜头切换与叙事结构,显示出原生多模态理解的深度。在创意写作测试中,它能生成技术细节准确、情感层次丰富的短篇故事。更值得一提的是,在理解中文特定语境(如分析相亲简历中的潜台词)或构思高情商回复等涉及“人情世故”的任务中,模型展现出了对中文社会文化语境的深刻洞察,这成为其区别于许多国际模型的一个显著亮点。
热门跟贴