打开网易新闻 查看精彩图片

作者:吴辰光

“声网在RTE(实时互动技术)行业首次实现广播级4K超高清实时互动体验。”10月24日,在RTE2023第九届实时互联网大会上,声网创始人兼CEO赵斌(如图)介绍了声网的最新成果。

赵斌指出,智能和高清正在推动实时互动体验进入全新时代,4K不仅仅只有分辨率一个纬度,光亮强度的动态范围、色彩的真实度、饱和度,以及色彩渐变的细腻程度,都是真正超高清体验里不可或缺的一环。

目前,大模型的交互界面仍局限于文字聊天互动方式,声网通过过去一年的投入和打磨,推出行业首创AIGC-RTC能力模块,可支持与任何大模型平台结合,实现更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交 、直播、游戏等多种场景提供新玩法、新机会。

赵斌认为,虚拟人+AIGC所创造的情感和情绪价值或将在未来解决社交供需不平衡的现状,并引领交互对象发生变化。另一层面,随着AIGC能力的进一步加强,越来越多的应用型开发将被AIGC替代,API+AI的形式将大幅提高应用开发效率。

声网合伙人兼客户成功副总裁孙雨润透露,根据声网某东南亚头部泛娱乐客户数据显示,当视频从标清升级高清,停留超过30秒观众数提升19%,观众人均观看时长提升30%,同时观众打赏率大幅提升。某国内知名社交出海App,从CDN 升级声网极速直播,送礼率增长12.3%。

Founders Space创始人兼CEO史蒂夫·霍夫曼指出,在AI和RTE技术的加持下,新的穿戴设备可能会进入市场,比如新的皮肤电子设备、感官增强设备等,可以让用户听到人类听力范围之外的频率。此外,脑机接口也将读取人们的脑电波,从而帮助人们实现冥想或对其他设备的控制。

大模型在带来发展机遇的同时,也带来了计算需求快速增长、算力受能源供给力限制、大模型数据资源不够、存储需求增长过快等问题。

声网首席科学家、CTO钟声表示,未来除了要做负责任的AI之外,在端上和边缘上的分布式实时智能将成为价值公平分配的重要技术手段,也是减缓中心化AGI对人类威胁的有效途径,这也注定会成为一个新的技术发展趋势

“AGI将走进实时互动,实现人人可分身,帮助在应用场景中复制名师、网红,甚至普通人也将通过AI分身丰富体验、缓解时间稀缺的瓶颈。具备端边实时智能的高清实时互动能力将成新趋势和竞争焦点。”钟声说道。声网首次实现广播级4K超高清实时互动体验