打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
以后机器人给你递水不会撞翻杯子,AR游戏里的怪物扑过来都带着真实距离感,连自动驾驶都能精准判断“前面车离我还有3米,能安全变道”。
打开网易新闻 查看精彩图片
最牛的是它在“AI月考”SPAR-Bench里,把顶流GPT-4o甩开18.5分拿第一,其他空间测试也都是“年级前三”水平,关键这哥们儿还是“小身材大能量”——参数才40亿,跟那些上千亿参数的“大块头”比就是个小不点,却靠“巧劲”赢了,主打一个“不拼蛮力拼智商”。
这AI的灵感居然来自人脑!咱们大脑看东西,一条路认“这是啥”,一条路判“在哪儿”。
打开网易新闻 查看精彩图片
G²VLM直接抄作业,搞了俩“专家”协作:一个专扒3D几何信息,算距离测角度;一个专搞语义理解,认东西唠嗑,俩专家实时传消息,就像打游戏时辅助报点+输出猛冲,配合得天衣无缝。
它的“修炼之路”也特有意思,分两步走:第一步让几何专家“闭关刷题”,对着带3D标注的数据练到“看图就知深浅”。
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
热门跟贴