「分不清谁是谁」,是开会时候的大Bug。

请听题:

打开网易新闻 查看精彩图片

有时候,会议室里是开了摄像头,

但在线

上还是不容易分清谁是谁:

打开网易新闻 查看精彩图片

(就像这样)

想弄明白「是谁在说话」,得靠听声、看嘴型。

总之,基本靠猜。

能不能帮我分出来会议室里的说话人?

收到收到,马上安排!

刚刚,腾讯会议发布腾讯天籁inside3.0。

简单来说,靠AI+16阵列麦拾音矩阵+音视频多模态识别算法,解决这几项烦恼:

1、人像分割:给会议室每人一个「小窗口」

基于「多说话人分离」技术,给到

会议室里每人一个1080p小窗口「特写」:

打开网易新闻 查看精彩图片

它的响应速度在毫秒级。

多人激烈讨论,也能迅速把C位切给最新发言人。

不管是侧对、背对摄像头,还是边走边说,都能确保始终在画面中心。

打开网易新闻 查看精彩图片

这只是「多说话人分离」技术的体现之一。

再举个例子:

如果多个人对着一台设备发言,

会后的智能录制也能把多个说话人区分出来。

打开网易新闻 查看精彩图片

2、

智能音幕:帮你的邻座「闭麦」

有时候,坐在会议室里说悄悄话,也得「小心

翼翼」。因为:

-A在发言,邻座B和C的低声讨论,对面可能听得也很清楚;

-A在发言,邻座B只是接了个电话,也会被无差别收音了。

能不能只收音指定区域,甚至指定人?

今后开会,会议室里可以划定收音范围了。

就像有一道无形的「智能音幕」,

支持定向区域拾音。