我正在尝试以192kHz作为回放的采样率来形成自己对宗教战争的理解(互联网似乎在两侧都有很多资料)。我正在努力了解重建滤波器的工作原理。

奈奎斯特-香农采样定理(经常被反192阵营引用)基本上指出44.1kHz的采样率足以重建而不会丢失20kHz的带限信号。但是,在看Whittaker-Shannon插值公式时,在我看来,理想的重构滤波器将需要访问所有样本,即所有过去和将来的所有样本。

我是不是模拟音频方面的专家,但我怀疑是否可以构建这样的设备。我认为,充其量可以引入延迟,以“等待”足够的将来样本到达,以便使不可用的将来样本对当前输出瞬间的贡献可以忽略不计。

有人可以吗?解释实际的重建过滤器如何工作以及它们的权衡是什么?如果只有样本窗口可用或重建延迟不可接受,那么在理论上对Nyquist-Shannon定理有更严格的限制吗?

#1 楼

通过允许数字过采样滤波器引入的延迟增加,可以将滤波器的其他特性(通带和阻带纹波以及过渡带宽)提高到任意接近零。可以增加过采样因子,以加宽阻带并放宽对模拟滤波的要求,从而导致计算复杂性增加,但滤波器引入的延迟时间却没有明显增加。

音频DAC通常具有一个数字过采样滤波器,可以在低延时(延迟)滤波器和尖锐的频率响应滚降滤波器之间进行选择。低延迟滤波器可以是最小相位滤波器,也可以是在低色散(某些频率比其他频率延迟得更多)与低有效延迟之间进行心理声学调整的折衷方案。陡峭的滚降滤波器通常是具有对称脉冲响应和通带和阻带中指定的最大纹波的线性相位滤波器。这种规格很容易在数据表中表达,也很容易纳入系统设计中。可以使用remez在八度中设计可比的等波纹线性相位滤波器,此处通带和阻带纹波的权重相等:受remez可以处理的无数值问题的限制),其通带范围为0至20 kHz,阻带始于24.1 kHz,并可以选择少量过采样频率,该过采样频率为44.1 kHz采样频率的2和4倍,并绘制了图1所示的阻带纹波特性,以及旭化成(AK4499),ADI(AD1955)和Cirrus Logic(CS43198)的旗舰音频DAC的等效过采样数字滤波器。 />图1. 2倍(蓝色)和4倍(橙色)过采样的阻带和通带纹波remez-设计的线性相位低通数字滤波器,具有相同的通带和阻带权重,是单位为脉冲响应半长的函数在14.1倍采样频率44.1 kHz下的采样周期还绘制了用于选择DAC过采样滤波器的阻带纹波性能数据,对于AK4499的8倍过采样数字滤波器,相应的通带纹波被指定为5×10 ^ -3 dB,对于组合数字和数字滤波器,则指定为10 ^ -2 dB。 CS43198的模拟滤波器,AD1955的8倍过采样数字滤波器的2×10 ^ -4 dB。此处比较的所有滤波器都具有相同的过渡带边界:20 kHz至24.1 kHz。

对于44.1 kHz采样频率,图1给出了线性相位过采样数字滤波器性能的下限,它是引入的延迟的函数通过滤波器,当通带和阻带纹波均被加权时。该界限并不明显取决于过采样率。 DAC制造商可以选择其他权重,例如,通过增加通带纹波来获得较低的阻带纹波,例如AK4499。他们还可以通过严格等波纹以外的其他标准来优化滤波器。例如,滤波器可能包括通过模拟电路(零阶保持,RC滤波器等)对高频衰减的补偿,并且滤波器延迟特性可能会受到使用计算效率高的多速率实现的影响。 />
通过绘制其脉冲响应(图2)和频率响应(使用remez(2*86, [0, 20/44.1, (44.1-20)/44.1, 1], [1, 1, 0, 0], [1, 1], "bandpass", 128)(图3)),我们可以仔细查看图1中来自freqz的性能最高的滤波器: />
图2.来自remez的性能最高的线性相位2x过采样滤波器的脉冲响应。

图3.来自remez的性能最高的线性相位2x过采样滤波器的频率响应。看一下8x过采样滤波器会更有趣,但remez却因error: remez: insufficient extremals--cannot continue而失败。

评论


$ \ begingroup $
你知道当某件东西(音频系统)听起来确实不错时,那么其解释(数据表)就必须做得更好!.. :-)这就是他们在商业音频行业中所采用的方式... ;-))
$ \ endgroup $
– Fat32
19年8月2日,0:34



$ \ begingroup $
哇!我需要重新阅读您的答案几次才能完全处理它。不错的工作!只是为了确认我的要旨,具有数字过采样功能的高质量DAC在44.1kHz的采样频率上引入了0.6-1ms的延迟?
$ \ endgroup $
–user1202136
19年8月2日在14:19

$ \ begingroup $
@ user1202136是,如果选择了尖锐滚降滤波器,那是正确的。
$ \ endgroup $
–奥利·尼米塔洛(Olli Niemitalo)
19年8月2日在18:58



#2 楼

采样定理要求一个完美的带宽受限信号,带宽受限于采样频率的两倍以下。问题在于,只有无限长的信号(例如,在大爆炸之前就存在)才能被完美地限制带宽。这来自傅里叶定理,关于任何具有有限支持的领域。

因此,所有现实世界的信号都具有不完全的带宽限制,受到记录会话的长度和采样前使用的低通滤波器的脉冲响应的持续时间的限制(例如,不完全的带宽限制)。因此,由于样本混叠,您必须假定本底噪声是有限的。因此,您的重建也不必比本底噪声更好。因此,您可以将理想的重建公式窗口化为合理的有限持续时间。对于音频,此窗口宽度可以限制为可听最低频率周期的一小倍,因为在此之前和之后的内容不会显着影响可听音调感知(其他内容,例如遮罩和自适应阈值等,可能会占主导地位。)

很高的采样率的优势在于,混叠频率(由于不完善的前采样滤波和后采样重建)甚至更高,而可能性更低可以由物理麦克风拾取,或以任何较大的幅度(在热噪声本底以上)通过抗混叠滤波器。正如这里的其他答案所详述的,这还允许物理上可实现的滤波器变得更平坦,并且在通用20-20k通带中具有更多的线性相位响应,并且滚降更接近采样率的一半。

评论


$ \ begingroup $
窗口宽度和可听到的最低频率之间的建议关系纯属巧合,对吗?
$ \ endgroup $
–奥利·尼米塔洛(Olli Niemitalo)
19年7月31日在9:47



#3 楼

快速回答,但由于人类的听觉不会超过20kHz带宽,因此44.1 kHz足以存储和传输音频。问题在于,ADC之前的模拟抗混叠滤波器必须非常尖锐才能通过足够的20 kHz并足以阻止22.05 kHz,这只需要许多具有良好性能和容差的组件。当以较高的采样率(例如192 kHz)采样时,模拟滤波器可以更简单,更便宜,因为它具有更宽的过渡频带,它需要通过20 kHz并以96 kHz的频率阻塞。可以数字方式进行速率转换和低通滤波,以实现截断而不会出现混叠。回放音频,对信号进行上采样和数字重建至192 kHz以进行回放时,同样的事情,而DAC输出模拟滤波器则既便宜又简单。重建滤波器只需要足够好,以至于在20kHz音频带宽之后没有太多的混叠频谱图像,而模拟滤波器则去除了DAC速率的实际频谱图像。因此,有必要在ADC和DAC上使用更高的速率,也许还可以掌握音频,但是传输和存储只有狗和蝙蝠才能听到的频率会花费更多,更不用说能够生产它们的设备(放大器,扬声器)了没有问题。因此,基本上每个数字采样只是一个无限窄的脉冲,以采样速率重复的脉冲会产生频谱图像,必须通过重建滤波器将其过滤掉,而重建滤波器只会使目标基带信号保持完整。

评论


$ \ begingroup $
“回放音频,对信号进行上采样并以数字方式重建至192 kHz以进行回放时也是如此”:我在这里很难理解。假设$ y [4n] $是您在192kHz时的上采样输出,$ x [n] $是您的48kHz输入。为精确计算$ y [j] $,您是否不需要知道所有$ x [i],i = 0,n $?如果是,当您不知道$ j / 4 $以上的输入样本时,如何实时上采样?
$ \ endgroup $
–user1202136
19年7月29日在12:58

$ \ begingroup $
易于实现的数字滤波器无法预见未来,因此它们是因果关系,仅适用于当前和过去的样本。因此,具有N个抽头的对称FIR滤波器具有N / 2个抽头的延迟。并且滤波器具有一定数量的抽头,仅足以在指定的公差范围内进行足够的滤波。也可以是IIR滤波器。或biquad。或多个级联过滤器。或根本没有滤波器,只需在实际采样之间添加零,然后让模拟滤波器完成任务即可。
$ \ endgroup $
–正义
19年7月29日在14:14

#4 楼

考虑到基本的音频应用,数模转换重建滤波器(又称插值滤波器)是一种低通模拟滤波器,可在到达扬声器之前除去输出端的所有图像频谱,并仅保留滤波器通带中的基带频谱:在其低通滤波器的截止频率内。请注意,扬声器本身也是重建低通滤波器特性的重要部分,理想的滤波器可以在适当的条件下充分放松。

插值滤波器的该通带(或截止频率)理想地应为根据数字信号的输入采样率选择。如果原始信号在44.1 kHz时已充分采样而没有混叠,则在正常情况下(假设系统内没有采样率转换),应将输出DAC采样频率和相关的内插滤波器截止频率选择为44.1 kHz和22.05 kHz分别。

如果以96 kHz采样输入,则输出重构DAC频率应为96 kHz,重构滤波器的截止频率应为48 kHz,等等。请注意,该理论使用了理想的脉冲和理想滤波器来描述事物(如上所述),但实际的DAC电路在输出和实际滤波器处使用零阶保持。

请注意,如果输入采样率和输出采样率之间不匹配则播放速度将与记录速度不匹配。同样,如果您选择的截止频率低于必要的最小值(即输出DAC采样率的奈奎斯特频率),那么您将淘汰信号频谱。同样,如果您选择的插值滤波器截止频率大于奈奎斯特频率,则音频输出会出现图像失真。

关于数字音频的一场宗教战争只是关于是否真的需要输入端的96 kHz采样率。而且共识是,根据多次进行的经验测试,这是没有必要的。但是亲爱的恋人仍然可以自由选择自己喜欢的采样率。

评论


$ \ begingroup $
“请注意,该理论使用理想的脉冲和理想的滤波器来描述事物(如上所述),但是实际的DAC电路在输出端和实际的滤波器中使用零阶保持。”放大这句话,这是否意味着在DAC阶段使用非理想滤波器会导致采样模拟输入的重构不完美?否则,使用非理想滤波器是否会“提高”奈奎斯特速率? (我完全购买了反192阵营的经验论证,但我感到围绕Nyquist-Shannon定理的理论论证与不理想的fil仍有差距
$ \ endgroup $
–user1202136
19年7月29日在13:08

$ \ begingroup $
理论答案如上所述。谈到实际的争论;的确,为简化(尖锐截止)模拟滤波器的设计,可以利用对输入(及其输出)的过采样。是的,这种系统有望产生较少失真的音频。但是,这里没有心理声学。只是过滤器设计。就我所知,关于高于20 kHz的内容是否在音频中增加了任何值(可听或相关)的争论。因此,您将受益于简化的滤波器设计,可能会获得略微失真的输出。那很好。
$ \ endgroup $
– Fat32
19年7月29日在14:24



$ \ begingroup $
可能令人惊讶,但是如果DAC具有零阶保持,则输出频谱不是平坦的,而是已经被正弦包络失真了。这称为光圈效果。它会衰减高频。可以通过增强高频的模拟重建滤波器在某种程度上补偿它。再次在DAC上将48kHz采样到192kHz的另一个原因是,使20kHz的音频带宽与DAC输出采样率相距甚远。任何模拟或数字滤波器都不需要是理想和完美的,只要足够好,您就不会听到非理想的声音(或对其进行测量)。
$ \ endgroup $
–正义
19年7月29日在14:30

$ \ begingroup $
@Justme是,建议采用反向Sinc幅度响应来纠正频谱失真...更高的采样率将使其更易于实现,但需要更多的处理能力和存储空间(或本身可以进行上/下转换)产生比非理想重建滤波器更大的失真!;-))
$ \ endgroup $
– Fat32
19年7月29日在14:47