我不知道如何称呼这些图像,但是它们在图像处理领域中经常用作标准示例,以显示特定操作的输出。这是指向将Lena描述为“标准测试图像”的页面的链接。是否有类似的规范音频片段用于演示某些音频滤波器或操作的效果?

#1 楼

我能想到的最接近的示例是Suzanne Vega的“ Tom's Diner”的开始,该版本已用于mpeg-1第3层开发,但仍偶尔用于演示音频编解码器。

评论


$ \ begingroup $
是的,Tom's Diner是一个相当干净(无混响)和单声道唱歌语音片段,可用于测试音高检测程序。另一个是Boyz II Men的剪辑,上面是甲壳虫乐队“昨天”的封面(最右边)。适用于单声道人声的音调跟踪。比汤姆的晚餐要难。我记得Digital Performer使用过它。
$ \ endgroup $
–罗伯特·布里斯托-约翰逊
2014年6月21日在22:20



#2 楼

音频处理是一个很大的领域,但是特别是在语音处理中,广泛使用的样本开放数据库被称为哈佛句。哈佛句子是美式英语中在语音上均衡的句子集合。也存在许多其他语言的等效数据库。

可以在此处找到带有哈佛语句语音的实际文件。

#3 楼

我还认为NIST数据库在语音识别任务方面非常受欢迎。实际上,这是在年度挑战期间比较新算法和技术的标准。

另外,MATLAB的load handel包含G.F. Handel的代码段-哈利路亚很常用。

#4 楼

欧洲广播联盟(EBU)的声音质量评估材料(SQAM)资源非常受欢迎。 https://tech.ebu.ch/publications/sqamcd

#5 楼

不要低估0 dBFS时1 kHz正弦波的功率。在单声道。由此可以发现很多信号路径错误的地方。

我已经构建并校准了足够的音频系统,可以准确地吹哨1 kHz。从简单的记忆。

除此之外,唐纳德·法根(Donald Fagen)创作的I.G.Y如此受欢迎,因为它被试音,许多节日都禁止这样做。