目前,复音音乐的转录似乎并不是一个可以解决的问题。

问题的一小部分反过来了。是否有某种频谱特征(来自STFT)可用于消除概率空间中的某些和弦? (例如,此声音片段很可能不包含任何C#和弦,或任何种类的小和弦,或者这是单个音符而不是和弦等)。

假设音频片段更多-或更少的静止音(消除了瞬态攻击等),并且很可能会出现大多数或所有单个音符的泛音。 (这个问题与倒立和弦无关。)

评论

如果您可以提供经典/经典/重要参考作为本主题的介绍,则可能会对将来的用户(和答复者)有所帮助。

#1 楼

近年来,复音音乐转录的问题在研究界引起了广泛关注,我什至可以说对于单乐器复音(钢琴,吉他等),效果非常好。这里有一些论文/作者对此问题进行了深入研究。德里·菲茨杰拉德(Derry Fitzgerald)在该领域做了很多工作,他在NMF上进行的许多有关信源分离的工作都能产生准确的转录。安西·克拉普里(Anssi Klapuri)更加专门研究了多乐器复音中的和弦检测问题。最后,尽管未发布,但Mikel Gainza已经开发出了非常精确的商业音乐和弦转录算法,很快将在基于吉他的软件产品Riffstation中发布。
链接中的出版物应该使您对如何使用目前存在和弦音乐转录景观。

#2 楼


是否有任何光谱特征(来自STFT)...这是一个音符,而不是和弦等)


为此,STFT只会包含一个基本频率成分和接近其谐波的其他频率(尽管由于不谐和,所以并不精确)。在频谱中找到峰值,然后查看较高的频率是否接近存在的最低频率的整数倍。如果存在非谐波频率,则不是单一音调。

(但是对于缺少基本音或根本不谐音之类的乐器,例如钟声呢?两把乐器的音调相差八度又如何,那么它们的子音大部分彼此对齐呢?可以将其检测为一个音符还是两个音符?)