品玩2月4日讯,商汤科技近日正式开源其多模态自主推理模型SenseNova-MARS,提供8B与32B双版本。该模型在多模态搜索与推理核心测试中以69.74的平均分超越Gemini-3-Pro(69.06分)与GPT-5.2(67.64分),成为全球首个支持动态视觉推理与图文搜索深度融合的Agentic VLM模型。

SenseNova-MARS具备自主规划任务步骤、调用多工具协同的能力,在MMSearch、HR-MMSearch等关键测试中均取得开源模型最优成绩。其特色在于能够处理需多步骤推理的复杂场景,如细节识别、信息检索与逻辑验证,显著提升AI在实际应用中的执行效率。

此次开源涵盖模型、代码及数据集,旨在推动多模态AI技术发展。商汤呼吁开发者与行业用户积极参与测试,共同探索智能体技术的落地前景。

打开网易新闻 查看精彩图片