人耳 20kHz 封顶，为什么数字音频都要记录和解析到更高的频率上去？

2016-04-29数码

基本原理两个：采样定理（

采样定理

）和实际的低通滤波器（

低通滤波器

）。

采样定理很多人都已经提到了，当采样频率大于信号频率两倍的情况下，可以完美地从这些离散采样里还原出原来的连续信号。这个定理很神奇，即使是看懂了数学证明很多人也还是觉得直觉上难以接受。没有从根本上理解这个定理是很多所谓的音频发烧友甚至是「工程师」经常犯错（例如鼓吹什么终端产品也要 96KHz 采样率）的根本原因。这里就不多扯了。

但是一个问题是，这个定理是有一个前提的——信号频率必须有限、小于采样频率的一半。然而现实中，麦克风所能接收、采集到的空气振动的频率范围是非常大的，远远超过人耳听力。如果直接把这样的信号采样，会导致出现混叠。所以必须要先使用一个低通滤波器，把高于阈值的信号过滤掉。然而我们并没有一个理想的低通滤波器！参考第一行的第二个链接，可以看到实际滤波器并不是以一条垂直的直线把信号拦腰砍断，而是一个快速下降的曲线。

音频采样率略高于 40KHz 的原因并不是考虑到「异常听力」——因为实际上 20KHz 这个频率已经有不少冗余了（看过一篇荟萃分析，这个数值是众多心理音响学实验的结果，互相交叉验证了）。再考虑到成年后高频率听力快速下降，不可能有人能听到 20KHz 以上的声音的。

原因其实是给实际低通滤波器留出空间！使得那一段不怎么完美的下降曲线落在 20KHz 之外，不影响音频效果。这个应该是个工程选择。 44.1KHz 被证明完全可以满足需要，另一种常见的 48KHz 也并不会在这一方面有优势。一开始的标准制定者在参考编码等因素后确定了这两大常见频率，尤其是 44.1KHz ，也就一直沿用下来了。参见

@JerryJazzy

回答中引用的那段计算。

c.f. CDDA

另外推荐两个很有帮助的视频：

Xiph.org: Video

P.S. 关于更高采样率对于人耳听音乐是否有意义，其实是在另一个知乎问题里讨论的。我也写了个回答：

人耳的频率范围最高20kHz, 那96kHz,192kHz采样率或更高有什么意义？ - 马宏菩的回答

根据评论区的讨论，补充一个要点：整个音频制作流中是有出现（有必要）使用更高采样率的地方的，一个肯定的地方便是播放时的 DAC 经常是 oversample 的（后者是 up-sample 到一个很高的频率，然后进行线性插值、平滑恢复成模拟信号，这么做的原因只是使用正弦函数在计算上困难，故而换做一个高效、numerically stable 的近似，并不是真的需要高频信号，整个过程对用户是完全透明的，不需要关心），另一个可能、也是更有实际意义的地方是音乐的采集、处理阶段，可能需要加工频谱，而这方面我就不熟悉了。正如上面链接的另一个答案所说的，消费者关心的最终产品（数字音频文件）中，高采样率是无意义（甚至可能有害）的。