我有数百小时的英语音频文件,需要转录成相同的语言。您知道我可以自动使用的语音转文本软件吗?


显然,自动转录并不完美,但至少对开始自动转录很有用。
至少支持英语
开源
它可以在Linux上运行,但其他平台也可以
音频文件在MP4上,但是我可以将它们转换为其他格式如果有必要
结果应该是简单的文本文件
隐私很重要,所以我不能使用在线服务

我想像它可以像使用它的应用程序像这样:

$ transcriber --input 001.mp4 --output 001.txt


像这样的东西,编写脚本来转录所有音频文件将很容易。

评论

这是一次性转录吗?使用在线服务可能会更好一些,例如IBM的Watson Speech-to-Text:显然不是开源的,但价格便宜,每分钟2美分,而前1000分钟免费。

我不知道这非常有趣,但是拥有开源的想法是节省一些钱,最重要的是,我将不必担心隐私问题,因为它将在我的计算机上运行。

Google搜索文字语音软件给我带来了例如返回页首语音识别软件产品,但我不知道这有多独立/好。

Interview转录软件的可能副本

@JanDoggen谢谢。您感动了右和弦!那就是我想要的。我在Wikipedia上发现了此链接。wikipedia.org/wiki/List_of_speech_recognition_software有很多选择,因此请务必尝试一下。但是,如果有人对一个应用程序或库有直接经验,我将保留此问题。

#1 楼

这听起来有些怪异,但是您可以将其上传到Youtube(假设其没有受版权保护的材料),并添加其自动CC,然后下载该文件。解决方案。

评论


隐私很重要。我更新了问题。不管怎么说,还是要谢谢你,

–JonDoe297
16年7月25日在21:22

我明白。您仍然可以将YouTube视为一个选项,可以将文件设为私有文件(已授权,您将在线上传文件)。我真的很好奇,如果您找到更好的解决方案

–ProjectPokket
16年7月26日在18:20

#2 楼

我建议使用https://transcribe.wreally.com。您的音频文件和转录都不会传输到他们的网站,因此可以满足您的隐私要求。您可以离线使用它,但必须在Chrome浏览器中使用它。 (很遗憾,它不能满足您的开源要求。)

它类似于youtube的转录过程,但效果更好。

评论


这个开源如何?您可以链接到他们提供的开源许可证吗?

–托马斯·韦勒(Thomas Weller)
16年8月21日在17:54

@ThomasWeller-我猜您错过了我写的“不幸的是,它不满足您的开源要求”。 JonDoe的请求涉及许多约束。我很清楚其中之一对我的建议不满意。

–aparente001
16年8月22日在0:11



好的。我认为可以,因为您明确提到了它。如果那句话是在您的原始帖子中,那我一定错过了。抱歉。

–托马斯·韦勒(Thomas Weller)
16年8月22日在20:23



@ aparente001我正在寻找的是自动转录软件。不仅是转录。我的错是,这个问题没有我想象的那么清楚。无论如何,我对其进行了更新并添加了新评论。谢谢。

–JonDoe297
16年8月23日在0:39

这是一个非常困难的问题。如果它是一位发言者,说话非常清晰,并且具有良好的声学条件,则可能可行。我引用的Wreally资料来源确实提供了此功能,但我尚未对其进行测试。尽管它不是开源的,但这可能是您进行现实检查的一种方法,即检查想法的可行性。

–aparente001
16年8月27日在15:44