原标题:国内第一!商汤日日新V6.5拿下多模态大模型2025年度收官之战

国内第一,商汤日日新V6.5拿下2025年多模态大模型收官之战!

12月29日,权威大模型评测基准 SuperCLUE 发布《中文多模态视觉语言模型测评基准12月报告》,商汤日日新V6.5(SenseNova V6.5 Pro)以75.35的总分位列国内第一,斩获金牌,并在视觉推理维度上拿下国内最高分。

商汤日日新V6.5领跑国内阵营,全球竞争力凸显

本次评测涵盖基础认知、视觉推理与视觉应用三大维度、二十项细分任务。测评结果显示,商汤SenseNova V6.5 Pro最新版以75.35分拿下国内模型第一。

在各维度能力对比中,报告指出,商汤日日新V6.5等国产模型在基础认知维度方面已接近头部平均水平,部分甚至看齐Gemini 3.0 Pro。而在视觉推理维度上,国产模型中只有商汤日日新V6.5超过了头部平均,处于行业领先地位,其余国产模型仍有明显差距。

具体而言,商汤日日新V6.5共在七个细分任务中取得国内第一,其中物体描述、文本识别、环境辨识、逻辑推理、代码设计、自动驾驶领域六大细分任务并列国内第一,科学推理任务斩获79.17分为国内最高。

此外,在表情识别、3D物体识别、数学推理、工业应用能力、医疗影像分析、图形界面理解、内容审核等细分任务中,商汤日日新V6.5也有优异表现,综合位居国内模型第一梯队,展现出全面的多模态认知、推理和应用能力。

坚持底层创新,以用户价值牵引模型迭代

多模态领域的突围,是商汤坚持“多模态通用智能”技术战略,以底层创新突破产业发展瓶颈的有力印证。从创新的模型架构、到数据壁垒的打通,再到训练范式的革新,商汤日日新大模型不断拓展多模态大模型的能力边界。

在今年,商汤还发布并开源的NEO多模态架构,重构了视觉与语言的融合机制,实现内生多模态能力,仅用1/10的数据就达到了同量级多模态模型的最佳水平;同时,通过结合多模态数据整合与超越Next Token Prediction的突破性跨视角预测(Cross-View Prediction)训练范式,商汤日日新在空间智能表现上超过了GPT-5、最新的Gemini-3 Pro,以及Cambrian-S。另外,商汤还基于算法、系统、模型、架构多层面的联合创新,实现了成本与效率的双重突破。

本月「商汤产品发布周」上,商汤发布了多个基于日日新大模型的AI应用与产品,为视频创作、AI办公、电商直播、具身智能以及人们的日常生活等,带来效率提升与智能化体验升级,让AI实现从“生产力工具”向“生产力”的跃迁。