“ Lena”，“ Mandrill”和“ Cameraman”等图像的音频等效形式是什么？

信号处理 | 2021-01-02 | 编程黑洞网 | 0条评论 | 518 人阅读

我不知道如何称呼这些图像，但是它们在图像处理领域中经常用作标准示例，以显示特定操作的输出。这是指向将Lena描述为“标准测试图像”的页面的链接。是否有类似的规范音频片段用于演示某些音频滤波器或操作的效果？

#1 楼

我能想到的最接近的示例是Suzanne Vega的“ Tom's Diner”的开始，该版本已用于mpeg-1第3层开发，但仍偶尔用于演示音频编解码器。

$ \ begingroup $
是的，Tom's Diner是一个相当干净（无混响）和单声道唱歌语音片段，可用于测试音高检测程序。另一个是Boyz II Men的剪辑，上面是甲壳虫乐队“昨天”的封面（最右边）。适用于单声道人声的音调跟踪。比汤姆的晚餐要难。我记得Digital Performer使用过它。
$ \ endgroup $
–罗伯特·布里斯托-约翰逊
2014年6月21日在22:20

#2 楼

音频处理是一个很大的领域，但是特别是在语音处理中，广泛使用的样本开放数据库被称为哈佛句。哈佛句子是美式英语中在语音上均衡的句子集合。也存在许多其他语言的等效数据库。

可以在此处找到带有哈佛语句语音的实际文件。

#3 楼

我还认为NIST数据库在语音识别任务方面非常受欢迎。实际上，这是在年度挑战期间比较新算法和技术的标准。

另外，MATLAB的load handel包含G.F. Handel的代码段-哈利路亚很常用。

#4 楼

欧洲广播联盟（EBU）的声音质量评估材料（SQAM）资源非常受欢迎。 https://tech.ebu.ch/publications/sqamcd

#5 楼

不要低估0 dBFS时1 kHz正弦波的功率。在单声道。由此可以发现很多信号路径错误的地方。

我已经构建并校准了足够的音频系统，可以准确地吹哨1 kHz。从简单的记忆。

除此之外，唐纳德·法根（Donald Fagen）创作的I.G.Y如此受欢迎，因为它被试音，许多节日都禁止这样做。