凤凰网科技讯 1月30日,商汤科技宣布开源其多模态自主推理模型SenseNova-MARS,提供8B与32B两个参数版本。据官方信息,该模型在多模态搜索与推理的基准测试中综合得分69.74,超过Gemini-3-Pro与GPT-5.2等模型。

该模型被定位为Agentic VLM(视觉语言模型),支持动态规划步骤与调用多种工具,让AI真正具备“执行能力”。

打开网易新闻 查看精彩图片

SenseNova-MARS的应用场景包括从图片中识别微小标志、搜索关联信息并进行多步骤推理。例如,可自主调用图像裁剪、文本与图像搜索工具,完成识别赛车服logo、查询公司背景等复合任务。

在训练方法上,模型采用了自动化数据合成构建复杂推理链路,并结合强化学习进行优化。技术细节已发布在相关论文中,开发者可获取模型进行测试与使用。