编程黑洞网
首页
编程
数据库
代码审查
网络应用
Android
wordpress
软件推荐
软件工程
逆向工程
信息安全
软件质量测试
地理信息
密码学
网站管理员
元堆栈交换
网络工程
操作系统
Ubuntu
计算机
Unix和Linux
服务器故障
Vi和Vim
运维
物联网
机器人
树莓派
计算机图形学
信号处理
如何将电话音频分为静音/非静音?
信号处理
|
2021-01-15
|
编程黑洞网
|
0条评论
|
1066 人阅读
我的问题是我不知道背景噪声的能量,所以我不能仅仅限制能量。处理是实时完成的,我有大约500毫秒的时间来决定。
理想情况下,我希望安静的辅音被认为是非静音的。
评论
我没有足够的信息来提供完整的答案,但是您的问题被称为语音活动检测。并没有达成共识的最佳方法,而且如果您看的话,可能会遇到许多不同的方法。也许其他一些可以充实它。
@Michael Litvin,有一类非线性滤波器(在“能量检测”中使用,名称为“ Teager-Kaiser”。我认为它是所谓的“ voltera内核”的子集。抱歉,我无法提供任何更多信息,但是如果您搜索这些单词,您可能会找到所需的信息。我知道,Teager-Kaiser方法用于“何时”鲸鱼的声音相对于背景噪声才开始。
#1 楼
您可以查看很多参数:
总体能量
短期频谱:语音具有相当独特的“粉红色”频谱和噪声(这是如果是电主导的,则发生在非语音部分)趋于白色;如果是声学背景噪声或传声器噪声,则趋向于“红色”(即低频沉重)。幅值统计。大多数噪声信号具有高斯分布,语音更接近拉普拉斯分布。
我认为,这三种信号的组合应能提供相当鲁棒的检测方案。
通过使用较大步长的差=与矩形窗卷积来计算信号的平滑导数
在计算机立体视觉中,“向内看”是什么意思?
标签列表
java
(11)
r
(3)
r-faq
(3)
javascript
(17)
jquery
(3)
asynchronous
(2)
php
(17)
mysql
(7)
sql
(3)
html
(2)
regex
(2)
arrays
(2)
variables
(3)
warnings
(2)
language-agnostic
(2)
c++
(9)
c++-faq
(8)
parsing
(2)
debugging
(5)
c
(3)
error-handling
(3)
python
(10)
pandas
(3)
android
(3)
list
(3)
最近发表
IP地址错误的错误掩码
在Cisco IOS中自动进行配置备份(每分钟)
VRRP和HSRP有什么区别?
IP地址如何映射到MAC地址?
网站可以识别我的MAC地址吗?
在STP中如何选择根桥?
为什么要使用三根以太网电缆将交换机连接到路由器?
为什么10.1.255.255是无效的广播地址?
为什么将IP地址分配给每个接口而不是设备?这将意味着什么?
为什么Visual Studio 2013不愿意运行我的Web性能/负载测试?
对测试代码了解太多会不利吗?
如何隔离错误?
如何使用Selenium和WebDriver清除localStorage
评估测试项目
我如何说服管理层我们需要一个正式的质量保证部门?
FluentWait与WebDriverWait有何不同?
简历和求职建议-从开发到测试的职业转变
您如何等待Selenium 2中的jQuery Ajax调用完成
在持续开发下测试应用程序
Selenium的页面加载默认超时是多少?
IT项目中软件测试的真正商业价值是什么?
系统测试与系统集成测试(SIT)有何不同?
如何找到我们的“质量保证流程”的弱点?
测试人员应如何处理生产中发现的错误?
如果我不使用TDD但想过渡到敏捷,那我应该回去创建那些单元测试吗?
代码覆盖率和测试覆盖率有什么区别?
当团队想要忽略关键但难以重现的错误时,我应该如何应对
测试人员应该修复错误吗?
审核测试自动化代码的良好实践
质量检查人员应该能够编写测试代码吗?
随机文章
为什么我的浏览器认为https://1.1.1.1是安全的?
如果付费应用程序停止工作,我可以取回我的钱吗?
Google发生碰撞攻击后,RSA-SHA1签名仍然安全吗?
处理分发给客户的操作系统和软件维护/硬件更新
如何可视化使用Consul运行的动态微服务架构?
是否可以从已知的密文-明文对中获得AES-128密钥?
什么是/ usr / local / bin?
通过我们新的“电子邮件设置”功能控制您收到的电子邮件类型
工资谈判问题
如何在具有隐含曲面(球体)的光线跟踪中实现构造实体几何?
评论
我没有足够的信息来提供完整的答案,但是您的问题被称为语音活动检测。并没有达成共识的最佳方法,而且如果您看的话,可能会遇到许多不同的方法。也许其他一些可以充实它。@Michael Litvin,有一类非线性滤波器(在“能量检测”中使用,名称为“ Teager-Kaiser”。我认为它是所谓的“ voltera内核”的子集。抱歉,我无法提供任何更多信息,但是如果您搜索这些单词,您可能会找到所需的信息。我知道,Teager-Kaiser方法用于“何时”鲸鱼的声音相对于背景噪声才开始。