三个问题:


客观地可以用来测量音频插值质量的所有指标是什么? (如果可能的话,还包括心理声学方面的信息)
通过这些指标,音频插值技术的最新状态是什么?
我要从虚拟乐器中的一系列音符中渲染两个文件两种分辨率,然后将一个文件的上采样与高频渲染版本进行比较,那么可以使用哪种软件客观地比较这些文件? -理想情况下,使用上述指标

到目前为止,从我已经能够收集到的角度来看,这些重采样器提供了一些质量最好的


http: //www.mega-nerd.com/SRC/
http://sox.sourceforge.net/SoX/
http://www.izotope.com/tech/src/

这些重采样器似乎存在的问题之一是前振铃和后振铃。

我应该注意的是,关键的是信号重构(因为该术语意义重大),因此进行上采样编辑:在这种情况下,插值时间效率无关紧要。

最好的问候,
好奇:-)

#1 楼

关于重采样器您注意到的“问题”:许多重采样算法使用线性相位低通滤波器多相位插值内核。与线性相位插值内核(具有相同的频率响应)相比,最小相位滤波器插值内核会在重新采样到更高的采样率时产生较少的预振铃,这可能客观地测量为精度较低,但可能会产生心理干扰。

这里是有关创建最小相位滤波器以进行可能较少预振铃的滤波的说明:http://www.music.columbia.edu/pipermail/music-dsp /2004-February/059372.html

此外,由Remez(Parks-McClellan)设计的低通滤波器在频域中可能会有明显的周期性波动,这也可能会产生振铃前脉冲在时域。因此,对于重采样插值内核,您可能想尝试使用窗口Sinc或经典模拟滤波器的衍生产品,以进行低通滤波器设计(后者通常会导致相位更接近最小相位)。

评论


$ \ begingroup $
关于最小相位滤波器的观点:我不确定前两个环节,但是iZotope的SRC允许在最小和线性之间连续可变相位。在听力测试中,人们确实会喜欢最小相位和线性相位之间的某个地方。
$ \ endgroup $
– schnarf
2012年1月31日,凌晨3:04

$ \ begingroup $
就时域振铃而言,开窗Sinc滤波器不一定比等波纹(通过Remez交换设计)滤波器更好。振铃效应称为吉布斯现象,当您限制包含不连续信号(例如方波)的信号时会观察到。它不是由等波纹滤波器的频域纹波引起的。当您使用截止频率非常高的滤镜时,效果会更明显。增加过渡宽度可以有所缓解。
$ \ endgroup $
–Jason R
2012年1月31日12:48



$ \ begingroup $
@Jason R:时域中的正弦波=频域中的脉冲,位置取决于正弦波的脉动率。现在反转两个域,并在频域响应中放置一个类似正弦的波纹。脉冲进入时域,其位置取决于纹波特性。
$ \ endgroup $
– hotpaw2
2012年1月31日13:18

$ \ begingroup $
@ hotpaw2:我看到你的比喻。我误解了您所说的“振铃前冲动”的意图。
$ \ endgroup $
–Jason R
2012年1月31日13:24

$ \ begingroup $
此外,时域中的平滑窗口通过卷积在频域中的不连续周围再现其非间断形状,从而减少了吉布斯过冲。
$ \ endgroup $
– hotpaw2
2012年1月31日下午13:32

#2 楼

重采样算法有一个非常全面的比较:http://src.infinitewave.ca/

您可以在那里看到他们使用的测试。混叠是一个很大的问题,使用正弦波谱图可以很容易地将其可视化。还有高频响应-SRC除了可以使高频产生混叠外还可以降低高频。您可以使用脉冲响应图或相位响应图可视化相位响应。

评论


$ \ begingroup $
是的,我知道这个很好的资源。我只是想知道在测量重采样(尤其是上采样)性能时所有值得测量的参数。
$ \ endgroup $
–弯曲的拉斯穆森
2012年1月31日20:24