原标题:交互入口的下一站:从屏幕到机器人,从服务到陪伴,AI正在走出文本框,进入真实世界

10月29日,魔珐科技宣布正式上线具身智能3D数字人开放平台——魔珐星云,不仅为AI提供了“身体”与“表达”,更将推动各类终端设备向具身智能体演进。

在魔珐星云的赋能下,从手机、平板、电脑,到商显屏幕、电视、车载大屏,任何屏幕都可以升级为能自然交互的具身智能体,让每一块屏幕都能“能说会动”,从信息载体变成交流和服务入口。

打开网易新闻 查看精彩图片

同时,平台赋能也延伸至机器人领域,赋予人形机器人更自然的语音、眼神与手势交互能力,使其从执行基础操作的“蓝领”进阶为具备服务与交流能力的“白领”伙伴。

在政务服务、教育、零售门店等众多领域,魔珐星云可提供低成本、高效率、规模化的交互式具身智能服务。开发者、系统集成商及生态伙伴可基于星云快速构建各类应用,涵盖App、小程序、Web端、智能座舱、零售展厅等多种场景。

AI很强大,但交互依然是文本框

过去几年,大模型让AI拥有了强大的思考与理解能力,但人们与AI的交互方式依然停留在“文本框”。这种交互高效,却缺乏温度与存在感。换句话说,AI的短板从来不是智商,而是缺少一个身体。

人机交互的发展史,本质上是人与系统之间“距离”的变化。从早期的柜台、人工窗口,到如今的图形化界面(UI),效率越来越高,但“人感”越来越弱。

当交互完全依赖按钮、菜单、表单,人们需要主动学习机器的逻辑。而真正自然的交流方式——对视、语气、表情、手势,却在数字化浪潮中逐渐消失。

AI大模型的出现,让机器第一次具备了“理解人话”的能力;但想要让机器真正像人一样“表达自己”,还缺少另一半——身体。

技术突破:打破铁三角难题

具身智能”(Embodied AI)这一概念,不只意味着“人形机器人”,而是让AI具备感知、表达与交互能力——拥有能看、能动、能交流的“身体”。

这个“身体”,可以是:

•屏幕上的3D数字人;

•手机App里的虚拟助手;

•商场大屏上的智能导购;

•机器人中的表达模组;

•甚至是AR眼镜里的虚拟伙伴。

然而,当前3D数字人在大规模应用的过程中面临三大挑战,一是质量问题,数字人的语音、动作、表情和口型,是否和真人一样自然?二是延时问题,用户在问数字人问题时,如果时间过长用户就会失去耐心;三是成本问题,如果成本过高,客户就难以承受。

由于难以兼顾三者,数字人交互难以实现规模化商用。然而,魔珐星云通过文生多模态3D大模型+技术实现路径的协同突破,打破“不可能三角”。

模型层面,魔珐星云通过自研的文生多模态3D大模型,直接将文本/语音转换为语音、动作、表情、手势等多模态的3D表达信号。

架构层面,则进行云-端拆分。云端只生成轻量级的动作和语音参数(非视频流),包含音频波形特征与3D骨骼、表情、手势等语义动作信号,极大降低下行带宽;而在端侧,通过AI/解算模块,将这些参数实时转化为画面。

得益于模型和架构的协同突破,魔珐星云能够同时具备六大优势:

打开网易新闻 查看精彩图片

1、高质量。形象逼真、表情灵动、动作自然,达到影视级表现力;

2、低延时。将驱动延迟压缩至500ms以内,在交互时可随时打断;

3、高并发。支持海量用户同时接入,满足企业级高并发业务场景;

4、低成本。可在RK3566/3588等百元级芯片上运行,实现低成本规模化部署;

5、多终端。适配多场景应用需求,同时支持超写实、二次元、卡通等多元角色风格;

6、完全兼容国产信创芯片体系。

这些优势为具身AI规模化打下了坚实的基础,让3D数字人大规模商用得以实现。

广阔的应用场景

魔珐星云以SDK与API形式全面开放,任何开发者只需调用接口,即可快速构建自己的应用,让任何屏幕、终端或App都能“具身化”:

•政务大厅:数字工作人员24小时在线,用表情和手势指引办事流程;

•教育场景:虚拟讲师以自然语调讲解课程,用动作强化理解;

•零售门店:广告屏变为可对话导购,根据顾客表情与语气实时调整推荐;

•酒店与服务业:数字前台能“看着你说话”,提供更自然的交流体验;

•机器人系统:星云输出的动作参数可映射至机器人,实现更自然的身体表达。

可以预见的是,当具身化能力以低成本嵌入到每一个终端,AI的交互方式将被彻底改写——从输入输出的逻辑界面,变成“面对面”的自然沟通。

而发布会上,最先嗅到商机的是显示器制造商。光屿智联CEO冯晨表示,在显示器行业竞争饱和的当下,有了魔珐星云平台,公司可以在原有的屏幕上给出更多交互方案,“对用户来说,那将是一种超越预期的震撼体验。”

打开网易新闻 查看精彩图片

深耕LED显示屏多年的万屏时代CEO黄锴认为,魔珐星云的发布将极大拓宽整个显示器行业的市场边界,“我们作为大屏基座提供商,与多家头部数字人公司合作。头部公司产品优秀,但整个行业产品质量参差不齐,成本高(每路需昂贵GPU),服务不稳定,难以实现7×24小时无差错服务。数字人能力的局限束缚了行业发展,大家都在低水平重复造轮子。”

打开网易新闻 查看精彩图片

他形容魔珐星云是“行业中的六边形战士”:“有了魔珐星云提供的具身智能底层能力,未来行业可以打造广告一体机、会议一体机,还有银行、医院等多种场景。原来是百亿市场,未来可以是千亿和万亿市场。”

未来

当前,AI的“第二步”已经开始——从理解人类语言,到以身体语言回应人类。当魔珐星云这样的平台把表达力标准化、模块化、开放化,AI不再只是算法或内容生成工具,而是具备交互能力的智能个体。

未来,具身智能将成为人与机器之间新的基础接口。从手机到车机、从商显到机器人,每一块屏幕都可能成为AI的“新身体”。