<1><2><3><4><5><6><7><8><9><10><11><12><13><14><15><16><17><18><19><20><21><22><23><24><25><26><27><28><29><30><31><32><33><34><35><36><37><38><39><40><41>

嗨,各位朋友好,我是小玖。

你是否曾幻想过这样一个画面:未来的某一天,只需轻声一句“准备用餐”,家中机器人便自动完成整套餐桌布置流程——从取出餐具到精准摆放,一切井然有序,如同专业管家亲临现场。

这并非遥不可及的科幻桥段,而是正在逐步实现的技术现实。今天,小玖要带大家深入了解的,正是推动这一场景落地的核心突破。

科学家正通过前沿技术,教会机器人理解人类社会中那些“不言自明”的行为规范与生活逻辑,也就是我们常说的“常识”。

打开网易新闻 查看精彩图片

从“机械执行者”迈向“情境理解者”

回顾过去,若想让机器人完成类似摆桌子这样看似简单的任务,整个过程异常复杂且僵化。

研发人员必须编写详尽至极的操作脚本,每一个动作都需精确设定参数:“前进1.5米,右臂抬升30度,夹爪张开至5厘米,抓取盘心位置,移动至桌面指定坐标上方10厘米处释放……”

打开网易新闻 查看精彩图片

此时的机器人更像一个毫无判断力的程序傀儡,只会照章办事,对为何如此操作毫无概念。

它不知道餐盘为何居中、叉子为何在左、刀具为何在右,一旦环境出现微小变动,例如椅子偏移或新增障碍物,原有指令链便会失效,系统往往需要重新调试甚至重构。

问题根源在于,传统机器人缺乏人类通过日常经验自然积累的背景知识体系。

打开网易新闻 查看精彩图片

而如今,随着大语言模型(LLM)的飞速发展,这一长期困扰学界的难题迎来了转机。

由美国纽约州立大学宾汉姆顿分校张世琦教授领衔的研究团队,近期发表了一项具有里程碑意义的成果。

他们提出名为“LLM-GROP”的创新框架,成功将大语言模型所蕴含的广泛常识性认知,与机器人底层的任务规划和运动控制系统深度融合。

打开网易新闻 查看精彩图片

这项技术的本质,是为机器人赋予一种能够解读模糊语义并结合常识进行推理的“认知中枢”。

现在用户只需发出指令:“把这些餐具合理地摆出来”,机器人即可自主解析“合理”的具体含义。

它知道主餐盘应置于座位正前方中央区域,左手边放叉,右手边依次放置刀与汤匙,水杯则安排在右上方约45度角的位置……

打开网易新闻 查看精彩图片

这些深植于文化习惯中的规则,被大语言模型转化为可执行的动作序列,并指导机器人逐一落实。

这种能力跃迁意义深远。

它标志着机器人正摆脱单纯依赖预编程指令的局限,朝着具备意图识别、情境适应与自主决策能力的智能体方向迈进。

其核心技术路径,在于实现了大语言模型强大的语义解码与知识调用功能,与机器人感知物理世界、生成动作策略的实际执行能力之间的高效协同。

打开网易新闻 查看精彩图片

在真实环境中灵活响应

不过,仅掌握“标准布局”仍远远不够。

现实空间充满不确定性:餐厅里有人穿行,桌旁可能临时堆放物品,光线变化影响视觉识别……

机器人如何像真人服务员那样,在动态干扰下依然稳定完成任务?

这正是LLM-GROP设计的另一亮点所在——引入计算机视觉系统,使机器人具备“观察—分析—调整”的实时反应机制。

打开网易新闻 查看精彩图片

研究组构建了一个双层智能架构,分为两个关键阶段。

第一阶段为“高层任务分解”:由大语言模型担任“战略指挥官”,依据通用常识将抽象命令拆解成清晰的子步骤流程,例如“先取大盘,再依次摆放餐具”。

第二阶段进入“底层动作生成”:机器人利用摄像头采集周围环境图像,结合物体位置与活动轨迹,动态计算最优站位与手臂运行路径。

打开网易新闻 查看精彩图片

它会综合评估距离效率与安全边界,确保既能顺利接近桌面操作,又能避开移动的人流与静态障碍物。正如张世琦教授所比喻:这就像餐厅服务员端菜上桌,既要快,也要稳。

为了验证系统的实用性,团队开展了一系列高难度测试。

在设置有随机移动障碍的真实场景中,机器人执行多物品布置任务的整体成功率达到了84.4%。

打开网易新闻 查看精彩图片

尽管尚未达到百分之百完美,但在开放、非结构化的现实条件下,这一表现已属突破性进展。

尤为突出的是,在仿真实验对比中,LLM-GROP方案不仅任务完成速度更快,最终的餐具排布也更符合人类审美与使用习惯。

打开网易新闻 查看精彩图片

这项工作的深层价值远超一次成功的实验演示。

它揭示了一条切实可行的技术路线,助力服务型机器人真正走入纷繁复杂的日常生活场景。

未来我们将迎来的不再是需要反复教导细节的“机械学徒”,而是一个能听懂话外之音、懂得生活常理、面对突发状况也能从容应对的“智慧伙伴”。

打开网易新闻 查看精彩图片

当然,挑战依然存在:比如精细抓握不同材质餐具的能力有待提升,操作失误后如何实现自我纠错还需深入探索。但整体发展方向已然明确。

当机器人真正内化了人类的常识体系,它们融入家庭、社区乃至公共空间的那一天,也许就在不远的将来悄然降临。

打开网易新闻 查看精彩图片

信息来源

文汇报2025-11-08AI加速,未来惊喜会更多

打开网易新闻 查看精彩图片

环球时报2025-09-29 15:03俄首个数字餐厅服务员投入使用

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片