5月8日,商汤科技发布新一代轻量化多模态智能体模型——日日新SenseNova 6.7 Flash-Lite。这款模型主打"真实世界工作流",直接瞄准办公场景里的硬核需求。
官方给它定的标签很直白:能看懂复杂网页布局、文档结构和财务图表,实现"看、想、做"一体化。翻译一下——以前AI看图表得先把图转成文字描述,再理解内容;现在它直接"看图说话",跳过中间商。
打开网易新闻 查看精彩图片
这个架构改动带来两个实打实的好处。一是参数量更小,能力反而更强,在权威智能体基准测试中拿下同级别多项SOTA;二是Token消耗直降60%,信息搜索场景下对比纯文本智能体,成本砍了一大截。响应速度做到毫秒级,适合高频互动的生产环境。
同日,商汤上线SenseNova Token Plan,首月免费开放:每5小时刷新1500次调用额度,无门槛。后续将推出Lite、Pro等付费档位。同时,全线办公技能SenseNova-Skills已在GitHub开源,开发者可直接取用。
技术细节和开源代码已挂GitHub,搜索OpenSenseNova即可找到仓库。对于想试水多模态智能体、又担心成本的中小团队来说,这波首月免费算是降低了试错门槛。
热门跟贴