当前位置: 华文问答 > 数码

人耳 20kHz 封顶,为什么数字音频都要记录和解析到更高的频率上去?

2016-04-29数码

基本原理两个:采样定理(

采样定理

)和实际的低通滤波器(

低通滤波器

)。

采样定理很多人都已经提到了,当采样频率大于信号频率两倍的情况下,可以 完美 地从这些离散采样里还原出原来的连续信号。这个定理很神奇,即使是看懂了数学证明很多人也还是觉得直觉上难以接受。没有从根本上理解这个定理是很多所谓的音频发烧友甚至是「工程师」经常犯错(例如鼓吹什么终端产品也要 96KHz 采样率)的根本原因。这里就不多扯了。

但是一个问题是,这个定理是有一个前提的——信号频率必须有限、小于采样频率的一半。然而现实中,麦克风所能接收、采集到的空气振动的频率范围是非常大的,远远超过人耳听力。如果直接把这样的信号采样,会导致出现混叠。所以必须要先使用一个低通滤波器,把高于阈值的信号过滤掉。然而我们并没有一个理想的低通滤波器!参考第一行的第二个链接,可以看到实际滤波器并不是以一条垂直的直线把信号拦腰砍断,而是一个快速下降的曲线。

音频采样率略高于 40KHz 的原因并不是考虑到「异常听力」——因为实际上 20KHz 这个频率已经有不少冗余了(看过一篇荟萃分析,这个数值是众多心理音响学实验的结果,互相交叉验证了)。再考虑到成年后高频率听力快速下降,不可能有人能听到 20KHz 以上的声音的。

原因其实是给实际低通滤波器留出空间!使得那一段不怎么完美的下降曲线落在 20KHz 之外,不影响音频效果。这个应该是个工程选择。 44.1KHz 被证明完全可以满足需要,另一种常见的 48KHz 也并不会在这一方面有优势。一开始的标准制定者在参考编码等因素后确定了这两大常见频率,尤其是 44.1KHz ,也就一直沿用下来了。参见

@JerryJazzy

回答中引用的那段计算。

c.f. CDDA

另外推荐两个很有帮助的视频:

Xiph.org: Video

P.S. 关于更高采样率对于人耳听音乐是否有意义,其实是在另一个知乎问题里讨论的。我也写了个回答:

人耳的频率范围最高20kHz, 那96kHz,192kHz采样率或更高有什么意义? - 马宏菩的回答

根据评论区的讨论,补充一个要点:整个音频制作流中是有出现(有必要)使用更高采样率的地方的,一个肯定的地方便是播放时的 DAC 经常是 oversample 的(后者是 up-sample 到一个很高的频率,然后进行线性插值、平滑恢复成模拟信号,这么做的原因只是使用正弦函数在计算上困难,故而换做一个高效、numerically stable 的近似,并不是真的需要高频信号,整个过程对用户是完全透明的,不需要关心),另一个可能、也是更有实际意义的地方是音乐的采集、处理阶段,可能需要加工频谱,而这方面我就不熟悉了。正如上面链接的另一个答案所说的,消费者关心的最终产品(数字音频文件)中,高采样率是无意义(甚至可能有害)的。