#1 楼
我能想到的最接近的示例是Suzanne Vega的“ Tom's Diner”的开始,该版本已用于mpeg-1第3层开发,但仍偶尔用于演示音频编解码器。#2 楼
音频处理是一个很大的领域,但是特别是在语音处理中,广泛使用的样本开放数据库被称为哈佛句。哈佛句子是美式英语中在语音上均衡的句子集合。也存在许多其他语言的等效数据库。可以在此处找到带有哈佛语句语音的实际文件。
#3 楼
我还认为NIST数据库在语音识别任务方面非常受欢迎。实际上,这是在年度挑战期间比较新算法和技术的标准。另外,MATLAB的
load handel
包含G.F. Handel的代码段-哈利路亚很常用。#4 楼
欧洲广播联盟(EBU)的声音质量评估材料(SQAM)资源非常受欢迎。 https://tech.ebu.ch/publications/sqamcd#5 楼
不要低估0 dBFS时1 kHz正弦波的功率。在单声道。由此可以发现很多信号路径错误的地方。我已经构建并校准了足够的音频系统,可以准确地吹哨1 kHz。从简单的记忆。
除此之外,唐纳德·法根(Donald Fagen)创作的I.G.Y如此受欢迎,因为它被试音,许多节日都禁止这样做。
评论
$ \ begingroup $
是的,Tom's Diner是一个相当干净(无混响)和单声道唱歌语音片段,可用于测试音高检测程序。另一个是Boyz II Men的剪辑,上面是甲壳虫乐队“昨天”的封面(最右边)。适用于单声道人声的音调跟踪。比汤姆的晚餐要难。我记得Digital Performer使用过它。
$ \ endgroup $
–罗伯特·布里斯托-约翰逊
2014年6月21日在22:20