前两年,有一篇《世界上最奇葩的公司》的微信文章刷过屏,这篇文章里所讲的奇葩公司就是日本雅马哈!为什么奇葩呢,是因为这个公司的业务种类实在是雷人,涵盖种类非常复杂。

我查阅资料,发现该公司是修钢琴起家,修着修着就开始做钢琴。做了钢琴,业务就发展去了两条线:一条走木工,一条走乐器。木工这条线呢,由于当时飞机螺旋桨是木头的,就以此进入了工业和机械领域,包括引擎和马达,以及家具,浴室等领域。而做乐器的那一条线,走入了电子乐器领域,顺带进入数字信号处理领域,这也给后来的DSP技术埋下伏笔。

DSP一直是雅马哈音响的独门绝技。对此,论坛上一直存有争议:反对的人认为声音发糊,音场虚了。支持的人认为正确的匹配DSP可以给影片音效加分不少。

我用过雅马哈的AV功放,可以说印象很不错。网友说的优点我全都体会了,对白厚,环绕活跃,音场开阔。对于DSP,我也是坚定的支持派。这是雅马哈音响很多前辈的心血,无论技术的更迭,我相信DSP都有用武之地。DSP打开音效变差的情况也会遇到,解决方法很简单,关闭就好了啊!

但是,之前的DSP,需要你跟进影片选择固定的DSP模式。比如你看的是文艺片,你可以选择文艺片模式,以增强对白的表现。而如果你看的是科幻片,那么需要你选择科幻片模式,以增强环绕声道的表现力。

那么问题来了,任何一部电影,都不是单一场景,它会有对白场景,也会有动作、爆炸等等场景,难道要我们随时跟进影片进行DSP模式的调节吗?所以这次的Surroud Ai解决了这个问题:它可以根据电影内容,有200毫秒来提取影片信息,然后进行判断,具体是对白还是环绕,还是低频需要增强,以达到最佳的优化效果。

图左为汤山先生

对于这项新技术,我们在上海和雅马哈DSP程序负责人汤山雄太进行了交流。

汤山告诉我们,Surroud Ai技术的核心,在于功放会根据播放的内容,每200毫秒为1帧进行实时音场效果的切换。是根据每部电影的实时音效场景哦,这当然对比之前需要选择DSP模式是一个非常大的改进。这一帧检测到是对白为主,就会增强对白。如果是其他,就增强其他。

这里总共有四种效果模式:1、对白:突出对白,自然位于屏幕中心。2、环境声:改善前后声音衔接,包围感。3、声效:提高每个声音的真实性,良好的透视声场。4、增强音:最有渲染力,宽阔声场。

那我的问题就来了,如果是电影,都是预先设置好的音效,那么打游戏,音效是根据玩家操作发出的,是无法根据预先提取来处理的,所以Surroud Ai无法应用于游戏吗?

汤山的回答是,Surround Ai可以用于游戏。因为雅马哈功放所处理的音效分为两种,直接声Direct Sound和效果声Effect Sound。不做任何处理的作为直接音,而200毫秒之后效果音才会出来。所以,直接音是同步的,并不影响游戏!

YAMAHA雅马哈推出的SURROUND:AI的初衷?

SURROUND:AI成功的实现了能够针对所有场景提供最适合的音场,飞跃性的提高家庭影院的临场感。

YAMAHA雅马哈长年以来为了追求家庭影院的临场感,研发了被称为CINEMA DSP的音场创生技术。通过数个音场系统(如Drama, Spectacle, Roleplaying Game等)来匹配不同的内容和客户的喜好来提升客户体验。

然而我们也收到一些反馈,如“不知道哪个音场系统才是最适合哪个播放内容”等。针对这样的课题,我们研发出了利用AI技术来自动判别播放场景的SURROUND:AI技术。电影内容中往往同时有不同的场景存在,单一模式的音场效果无法提供最适合的音场。但是,SURROUND:AI可以做到针对所有的场景提供最适合的声场效果,让客户感受到终极的试听体验效果。

YAMAHA雅马哈在未来还会推出超过13声道的AV功放吗?

今后,YAMAHA雅马哈将继续认真听取顾客的意见和需求,活用新技术来让更多的顾客获得满足,提案最适合的产品。

现在的3D环绕声格式将会往哪个方向发展?

我认为现在3D环绕声格式的功能已经开始逐渐增加,进入了普及阶段。今后,我也期待着出现让立体声音响能够更加有魅力的内容和功能。发展方向来说的话,我认为虽然增加声道数也是一个选择,但是适合客户的实际环境需要,用少量的喇叭也能很好的体验到3D环绕声效果,也是十分的重要。

如何看待如今的在线流媒体电影对音响产品的改变或影响?

变得能够随时随地都能都轻松享受各种各样的影视作品。让客户不仅是在家中,而且在室外也能使用便携播放器来欣赏影像内容将变得更加重要。室内播放需求也从AV功放这样的专业设备扩充为像回音壁这样简单轻松就能体验音乐和电影的产品。另外,不仅是形式的差别,根据音质和内容的不同也会出现差别。从LossLess标准的BD媒体到根据画质的优先来向Lossy传送的流媒体等,存在着各式各样的方式和内容。针对这样的情况,我们通过MusicEnhancer(压缩内容的音质改善)技术来应对。

电视节目和影音内容的差异也能通过SURROUND:AI这样动态最适化来提高环绕声体验。

无论内容和其传输、使用场合如何变化,追求更好的视听体验这点是不会改变的,我们秉承着这个宗旨,将继续进行产品和技术的研发。

AV放大器的发展速度出现放缓,如何看待未来的AV技术革新?

我认为,如何更能更好的欣赏影视作品、如何更好的传达艺术家的意图和表现力,是最为重要的。同样也代表着,欣赏作品的环境、不断追求临场感。“更加本质,更好的客户体验的友好性”,朝着这样的方向性简单明了的思考、更贴近客户。朝着提供雅马哈独有的音乐、声音体验而不断的进化。

请介绍一下从1986年的DSP-1到现在的CINEMA DSP的进化过程中变化最大的部分

最大的变化点有3个。首先是从演奏厅的音场再现变为电影内容的应用。其次是实现了立体声声场的再现。最后是从CINEMA DSP中培育而出的音场处理技术升华为本次的SURROUND:AI技术。对这个技术的进化来说,尤为重要的是适应当前时代的环绕声格式的算法的改善和程序改良、声场效果调整APP的对应等改善客户体验的一系列工作。

开发的契机是什么?

电影中存在着各种不同的场景,难以创造出万能的最适合的声场效果是常年来课题。特别是大约从10年开始伴随着DSP演算处理的进化,自然的声场效果的重现和AV功放的音质提高,更加细腻的声音表现成为了可能。我们梦想着能够实现能够检测出内容和场景的变化来创造最适合的声场效果,提供超越想象的试听体验。在此背景下的2015年的夏天,实现了DolbyAtmos和CINEMA DSP的整合之后,我们开启了根据不同场景提供最适合声场效果的适应型次时代CINEMA DSP的研究开发。

我们重新思考了客户体验、着眼于AI技术活用的研究开发、面向性能提供的方法和顾客获得的体验价值,研究/产品企划/产品开发三位一体,不断试错和前进。

今后的家庭影院环境将不仅限于从前的固态媒体,将更多的在流媒体服务中进行视听体验。在多样化的内容和场合下,希望顾客能够不用过多的为了设定而操心的进行视听体验,能够一键就能感受到完美的声场空间。

如何看待SURROUD:AI发展的可能性?

对于含画面的音乐内容,我认为表现力还有很大的提升空间。这能够通过AI深化和声场效果进化两方面来实现。如何提高投入感,如何追求临场感,如何追求各种的可能性的实现。

其次,我认为一键就能够获得最适合的临场感的体验的价值,对于使用各个产品线的客户也十分的有益。我希望摸索着把这样的雅马哈独创性很高的价值搭载在其他各式各样的产品之中。

将来的AI深化的含义,是“通过AI来理解客户的喜好,进行个人定制”的未来,也代表了能够判定、判别“对于各式各样的场景来说,哪个效果才是最适合”的专业领域。结合今后的AI技术的进化,我们希望继续摸索其可能性。

SURROUND:AI开发背后的故事

在研究开发的初期摸索阶段的状态下考虑和尝试的东西,全都进行的不顺利。其结果是,我们开始学习机械学习。为了能够探讨如何才能进行分类和判断,我们定下来每周都要在视听室确认一定数量的不同类别的电影。

SURROUND:AI专用的声场处理算法也经历了3次大的方针转换,花了半年时间才最终完成。这也全部是”提供怎样的体验“的开发团队的大家经过深思熟虑之后,才确定了SURROUND:AI旨在达到的临场感的雏形。

ICON(功能开启标志)的制作也是开发者考虑了希望顾客能够感受到AI的行为而特别制作而成的结果。它把AI的思考实时地应用到声场效果的表达模式中,直线的伸缩代表着AI的解析状况,圆周围的深淡表示这室内的声场。

为了能够让客户更容易的理解复杂的音场处理,不仅是研究开发、AV开发如何表示,销售和企划人员也一起参加了讨论。当然,AI的效果的可视化表现对我们公司的功放产品来说是没有先例的,所以也吃了很多苦,但是我们确信正因为是雅马哈才能够创造出这样独特的价值,并且提供给全世界的顾客。

最后,汤山给我们画了一张图,为了向汤山老师证明我们听懂了,我和dupin67也给他画了张图,补充说明。(最后吐槽下日本人英语,差的一匹!)

而新一代的雅马哈功放,自1085以上都会支持SURROUND:ai,包括旗舰前级CX-A5200。