“了解空间音频 ”系列教学连载9 高阶Ambisonics(HOA)


“了解空间音频”系列教学连载是由电影声音研学中心牵头,联合叮咚音频及同期录音网,与Sound Particles公司共同创办。我们将会为大家带来这个系列内容,深入探讨“空间音频”这个主题。
我们将联合Sound Particles官方,以每周一期在电影声音研学中心/同期录音网/叮咚音频公众号进行发布。每期视频将在5分钟左右,敬请期待。

本次是“了解空间音频 ”系列教学连载的第九期,还没有看过前八期的小伙伴请先点击后方链接查看:“了解空间音频 ”系列教学连载1 开篇、连载2 什么是基于通道进行处理、连载3、连载4 基于通道音频的利弊、第5集3-1、连载6 杜比全景声、连载7 更多基于对象的音频格式、载8 ambisonic先知道MS立体声。
在上一期我们已经了解了与ambisonic有很大关系的Mid-Side,那么什么是Ambisonics呢?
本期,Nuno Fonseca博士将为大家讲解:
• 什么是Ambisonics?
• 什么是高阶Ambisonics(HOA)?
• 多个Ambisonics版本

Ambisonics本质上是一种加强型的Mid-Side技术。想象一下,你除了使用一个指向两侧(左右轴方向)的8字形麦克风之外,再添加一个指向天花板的8字形麦克风(上下轴方向)和一个指向前方的8字形麦克风(前后轴方向)。再用全向麦克风替代心形指向中间的麦克风,这样拾取的单声道信号包括整个空间所有角度的信号,这就是Ambisonics。
传统的Ambisonics格式,被称为“一阶Ambisonics(B格式)”,这种格式使用4个音频声道:W声道是一种全指向性分量,就好像一个全向麦克风拾取现场声音一样,所以,这个声道有来自所有方向的音频。X、Y、Z 三个声道对应三个8字形,每个麦克风指向不同的方向:左-右,前-后,上-下。

当我们谈论Ambisonics时,它有许多不同版本,但通常人们指的是“一阶Ambisonics,B格式”。
所以,Ambisonics仍然是正常的音频信号,而不是让3D音效发挥作用的某种神秘黑魔法。Ambisonics只是音频声道:带有所有方向分量的单声道及以下3个分量的音频声道:左-右;前-后;上-下。
我们也可以说Ambisonics是Mid-Side技术的3D版本。就像我们不能直接用扬声器重放Mid-Side信号(这样做无法得到理想的前方声像)一样,也无法直接用扬声器重放Ambisonics信号:我们有4个音频声道,可以单独听到各个声道的信号(各自的常规音频——不是类似噪音的异常信号),但在利用任何扬声器布局重放这些信号前都需要“解码”。
目前市场上有一些一阶ambisonic麦克,最早的就是soundfield的产品(现在被RODE收购),更多具体介绍请看:往事并不如烟:SoundField的过去现在及未来 | 连载2 | 连载3 | 连载4 | 连载5

那么,我们能否仅使用4个音频声道就得到很准确的3D声像呢?不见得。虽然Ambisonics仅使用4个音频声道就可以达成重放3D音效环境的任务,但它的空间分辨率并不太高。这意味着每个声音在方向上有少许模糊。
在一阶Ambisonics常规的4个音频声道的基础上,为提高空间分辨率,我们添加了更多的音频声道:二阶Ambisonics,共9个音频声道,三阶Ambisonics,16个声道,四阶Ambisonics,25个声道,五阶Ambisonics,36个声道,六阶Ambisonics,49个声道,依此类推。

通过增加更多的声道,我们丰富了声像的细节。新增加的声道将继续携带音频信号,但会呈现更特殊的三维指向性,而不是传统的一阶8字形图像。数学上称之为球谐函数,因为就像声音可以在其频域谐波中分解,3D声场也可以在球坐标系用球谐函数分解。

虽然没有麦克风收音头可以直接具有这些特殊三维指向性,但可以使用带有大量收音头的特殊麦克风的信号中导出所需的信号,比如,Eigenmike®麦克风


当我们谈论Ambisonics时,很重要的一点需要考虑的是Ambisonics的“多版本”特点。否则就很容易犯错误,使用错误的格式或以错误的方式解析格式。为此,我们通过以下4个重要参数判断我们所谈论的Ambisonics版本:
• 阶数(一阶、二阶……)
• 格式(A、B……)
• 方位分量顺序(ACN、FuMa、SID)
• 归一化(SN3D、N3D、FuMa……)
我们首先需要确认使用的Ambisonics的阶数是什么:是不是一阶?还是二阶或三阶等?这很容易识别,因为阶数决定了我们得到的音频声道的数量。
我们需要确定的第二件事是:Ambisonics的格式是B格式还是A格式(其他格式都非常罕见)。直接从Ambisonics麦克风录制的音频属于A格式(每个声道代表来自特定收音头的音频),但我们应该尽快将A格式转换为B格式,因为B格式是Ambisonics的通用格式,也是大多数软件能够识别并设计使用的格式。
目前有不少现场录音机可以直接录制一阶ambisonic的B格式,对于后期制作的友好,这也是我们目前最常用的一种Ambisonic应用方式。
我们需要注意的第三件事是位分量顺序,即音频声道的顺序。坏消息是:Ambisonics内部有很多不同的音频声道排序方式,但好消息是:常用的很少。最初,声道都是以习惯指定的方式排序(W、X、Y、Z),但随着高阶Ambisonics的出现,声道顺序的排列方法就显得尤为重要,要实现理想的伸缩性,用一致的方法适用于从声道数较少到有更多声道、场景更复杂的情况,因此就出现了ACN顺序。

举例来说,在ACN中,一阶Ambisonics的声道顺序为 W、Y、X、Z;但在FuMa中,顺序则为 W、X、Y、Z。现代的Ambisonics平台使用ACN声道顺序,但使用旧版Ambisonics平台时要多加注意,因为旧版平台可能仍然使用之前的FuMa顺序。
还有一种SID排序方法,但目前几乎不存在了。如果您遇到Ambisonics方向错误的问题,应该从左侧播放的声音却跳至前方播放等, 这很可能是声道顺序引起的问题。
第四个重要参数是归一化,即调整声道增益到目标电平。这其中同样也包含几种方法(SN3D、N3D、maxN/FuMa),但目前SN3D是最常见的方法,因为一个特殊原因:在SN3D中,第一个声道(全指向声道)始终是最高电平的声道,如果您对这个格式的信号进行混音或录制,只需要注意第一个声道是否削波(如果这个声道不削波,其他声道也不会削波)。其他的标准化方法(如N3D)无法保证全指向声道为最高电平的声道声道,至少无法保证所有不同的声音方向都如此。

在说到这些参数时,有人可能会提到AmbiX,这是Ambisonics的一种特殊音频文件格式,使用B格式、ACN、SN3D。所以当提到AmbiX,可能并不是指这种文件格式,而是直接表示B格式、ACN、SN3D这些参数。所以要格外注意,确保您不会混淆不同版本的Ambisonics。
关于空间音频,请继续关注!

今年9月,电影声音研学中心正式开幕,已成功举办多期线下&线上公开课,录音师访谈活动,收获诸多好评,具体请看:梦想成真!“电影声音研学中心”第一次与大家见面、电影《断·桥》:声音制作幕后专访与视频、《旭日》全景声PT工程学习 庆电影声音研学中心开幕 免费公开课、“生长“-电影声音创作扶持计划、5.1环绕声短片《LONTANO》幕后制作专访、搞定影视声音制作的响度 电影声音研学中心免费公开课第2期
也开办过多期线下课程:影像声音制作全流程工作坊、RX10音频修复大师课,具体请看:关于“影像声音制作全流程工作坊”,你想知道的都在这里!|iZotope RX10官方总代认证课登场!
请大家多多转发支持我们!