大多数智能助手品牌,例如Amazon Echo和Google Home,在自定义唤醒方式(唤醒设备时使用的词组,以便其听您听到)的自定义方式方面提供的很少。 br />例如,Alexa仅提供三种选择,而Google Home仅支持“确定Google”。很多用户似乎对自定义唤醒词的概念很感兴趣,但是没有一个主要品牌增加了支持。

是否有任何技术上的理由限制唤醒词的自定义,或者仅仅是一个品牌选择?

我已经读过Google使用“ OK Google”的动机,这表明品牌构想可能是正确的,但似乎唤醒词识别也不是很准确,这可能是出于技术原因。任何人都可以弄清主要原因是什么原因吗?

评论

要记住的一件事是,要唤醒的处理必须在低功耗,始终在线的域中完成-在某些较大的SoC(尤其是电话中使用的SoC)中,通常有专门的硬件可用于此任务,我假设滤波器系数/其他参数是经过仔细计算的,并已加载到该硬件中。我忘记了运行哪个SoC Echo,但我想这里有一个类似的过滤器。算法类的名称此刻正在逃避我

#1 楼

是的,有几个原因。
这篇博客文章解释了有关回声和唤醒词Alexa的内容。我会总结一下。

唤醒词识别是在本地实时进行的。由于明显的处理限制,这限制了唤醒字的长度。此外,用户不想背诵一首诗来激活智能助手。因此,它必须简短。

它在被调用时必须以几乎100%的精度工作,并且在未被调用时也不能确定地识别。这会带来问题,还会使唤醒字的长度最小化。亚马逊允许Echo的选择非常令人惊讶,因为它只有两个音节。

如果我们看看通常的嫌疑人,我们有Alexa(3个音节),Amazon(3),Echo(2),Ok Google (4),Hey Cortana(4)和Hey Siri(3)。所有行业巨头几乎都同意三个音节是一个不错的选择。

奇怪的是,最想要的唤醒词“计算机”也有三个音节,很容易满足这一要求。它也不是商标。

博客告诉我们我们一个道理,我们完全想避免误报。让我们看一下计算机,Siri,Cortana和Alexa这两个词的建立方式。这是2008年的Google图书资料集。未找到。自从2008年开始是有意义的。从语料上讲,为什么计算机是另一个可怕的词汇。



该Ngram显示了美国最受欢迎的两种2016年的婴儿名字(用于货币)以及Tom和Dave也与计算机持平。女王,篮球和警察设法正确注册。无论如何,这使我们有了一个主意,为什么到目前为止尚未允许Computer,Earl Grey,Hot。人们经常使用计算机一词。

关于误报的另一件事。 Alexa的押韵几乎没人会说。



74种事物的计算机韵律。

评论


……这解释了Scotty为什么没有唤醒计算机的原因。

–加纳马
17年1月10日在19:34

“我要和一只鸟发生性关系……不,Alexa!”

–大卫说恢复莫妮卡
17年1月10日在20:56

“ OK Google”是四个音节(“哦,kao goo gull”),而不是三个,而且比许多音素还要多。

– Monty Harder
17年1月10日在21:30



Alexa是一个令人生畏的名字……我个人认识两个有这个名字的人,其中一个是堂兄。回声在我的语言中是按原样使用的,当电话或其他东西出现回声时,我经常说“有回声”。亚马逊是河流/老部落的名字,像我这样的角色扮演者经常说。他们真的搞砸了。

–奥利维尔·格雷戈尔(OlivierGrégoire)
17年1月10日在22:26

我不确定我对为什么“计算机”一词不起作用的解释。这个词本身并不是唯一被识别的东西。作为发声的第一个单词并紧接着停顿也是识别命令单词的重要信息。

–凯文·克鲁姆维德(Kevin Krumwiede)
17年1月11日,下午4:06



#2 楼


是否有任何技术原因限制唤醒词的自定义


当不使用辅助设备时,应用处理器(我认为ARM是Alexa以及Google Home) )处于暂停状态,并进入可能的最低功耗状态。唤醒字检测留给非常省电的DSP,DSP会监听环境噪声/声音并运行算法来确定是否与唤醒字匹配。如果找到具有足够置信度的匹配项,DSP就会唤醒ARM内核以继续进行其余的处理。

现在,由于目标是提高功率效率,因此有问题的DSP将算法运行为以及将模板模式存储在片上存储器而不是主板上RAM中。这使系统甚至可以将DDR RAM置于最低功耗状态。

由于DSP有许多关键工作要做,而且片上存储器很少,因此辅助唤醒字仅限于少数几个最佳选择。该算法可以高度自信地匹配该算法。