上周热火朝天的科大讯飞全球1024开发者节你参加了吗?
发布会上,科大讯飞重新定义万物智联时代的多模AIUI交互标准,在原有的远场高噪、全双工、多语种多方言能力基础上,升级了多模态能力,新增了超拟人和个性化能力。
这是超拟人数字人在本届1024大会上首次亮相,实现了多模态的交互从语音交互拓展到音视频流的实时多模交互。
如果你对“AI对话”的印象还停留在“已读乱回”、反复犯“常识性错误”等,那接下来的视频要刷新你的认知了!
简简单单的数学题,难不倒小学生也难不倒AI,当你以为AI听从指令被误导说出“1+3=5”时,别着急自信,AI有可能是在配合你演出。
让我们看看多模态视觉能力加持下的人机交互会带来怎样的惊喜?
1024的现场科大讯飞研究院院长刘聪给超拟人数字人打了个“视频电话”。
他不断调整道具“孙悟空”“奥特曼”“怪兽”的摆放位置,超拟人虚拟人就能“看图说话”,根据道具不同的摆设动作声情并茂讲述丰富的故事情节,和刘聪进行生动有趣的多轮畅聊。
突然就理解了那句耳熟能详的话:我们当年可没这个条件……
热门跟贴