我了解OpenCV是用于在C / C ++中对图像处理进行编程的事实上的库;我想知道是否有一个C或C ++库,用于音频处理。我基本上想过滤来自麦克风的原始波,并使用一些机器学习算法对其进行分析。但我最终可能还需要:


多平台音频捕获和音频回放
DSP-音频滤波器
音调检测
音调属性分析
音调合成
给出一些识别语料和模型的识别
语音/音乐合成

任何建议都将不胜感激。

#1 楼

请考虑以下内容:

clam-project.org:


CLAM(用于音频和音乐的C ++库)是用于研究和应用的完善的软件框架。音频和音乐领域的开发。它提供了概念模型以及用于音频信号分析,合成和处理的工具。


MARF:



MARF是开放式的资源研究平台,以及用Java编写并安排在模块化和可扩展的框架中的语音/声音/语音/文本和自然语言处理(NLP)算法的集合,以方便添加新算法。 MARF可以通过网络分布式运行,并且可以充当应用程序中的库或用作学习和扩展的源。


aubio:


aubio是一种用于从音频信号中提取注释的工具。它的功能包括在每次攻击之前对声音文件进行分段,执行音高检测,敲击节拍并从现场音频中产生Midi流。


#2 楼

您可能想检查一下普林斯顿声音实验室提供的各种代码库,例如STK(cufmo提到的MARSYAS只是其中的一个项目)。通过结合那里不同库的相关功能,您也许可以实现项目的目标。

#3 楼

这些级别可能不同,但值得一看> http://the.echonest.com/和http://vamp-plugins.org/

#4 楼

如果您喜欢音乐信息检索,则绝对应该签出:

MARSYAS