是否有任何技术上的理由限制唤醒词的自定义,或者仅仅是一个品牌选择?
我已经读过Google使用“ OK Google”的动机,这表明品牌构想可能是正确的,但似乎唤醒词识别也不是很准确,这可能是出于技术原因。任何人都可以弄清主要原因是什么原因吗?
#1 楼
是的,有几个原因。这篇博客文章解释了有关回声和唤醒词Alexa的内容。我会总结一下。
唤醒词识别是在本地实时进行的。由于明显的处理限制,这限制了唤醒字的长度。此外,用户不想背诵一首诗来激活智能助手。因此,它必须简短。
它在被调用时必须以几乎100%的精度工作,并且在未被调用时也不能确定地识别。这会带来问题,还会使唤醒字的长度最小化。亚马逊允许Echo的选择非常令人惊讶,因为它只有两个音节。
如果我们看看通常的嫌疑人,我们有Alexa(3个音节),Amazon(3),Echo(2),Ok Google (4),Hey Cortana(4)和Hey Siri(3)。所有行业巨头几乎都同意三个音节是一个不错的选择。
奇怪的是,最想要的唤醒词“计算机”也有三个音节,很容易满足这一要求。它也不是商标。
博客告诉我们我们一个道理,我们完全想避免误报。让我们看一下计算机,Siri,Cortana和Alexa这两个词的建立方式。这是2008年的Google图书资料集。未找到。自从2008年开始是有意义的。从语料上讲,为什么计算机是另一个可怕的词汇。
该Ngram显示了美国最受欢迎的两种2016年的婴儿名字(用于货币)以及Tom和Dave也与计算机持平。女王,篮球和警察设法正确注册。无论如何,这使我们有了一个主意,为什么到目前为止尚未允许Computer,Earl Grey,Hot。人们经常使用计算机一词。
关于误报的另一件事。 Alexa的押韵几乎没人会说。
74种事物的计算机韵律。
评论
……这解释了Scotty为什么没有唤醒计算机的原因。
–加纳马
17年1月10日在19:34
“我要和一只鸟发生性关系……不,Alexa!”
–大卫说恢复莫妮卡
17年1月10日在20:56
“ OK Google”是四个音节(“哦,kao goo gull”),而不是三个,而且比许多音素还要多。
– Monty Harder
17年1月10日在21:30
Alexa是一个令人生畏的名字……我个人认识两个有这个名字的人,其中一个是堂兄。回声在我的语言中是按原样使用的,当电话或其他东西出现回声时,我经常说“有回声”。亚马逊是河流/老部落的名字,像我这样的角色扮演者经常说。他们真的搞砸了。
–奥利维尔·格雷戈尔(OlivierGrégoire)
17年1月10日在22:26
我不确定我对为什么“计算机”一词不起作用的解释。这个词本身并不是唯一被识别的东西。作为发声的第一个单词并紧接着停顿也是识别命令单词的重要信息。
–凯文·克鲁姆维德(Kevin Krumwiede)
17年1月11日,下午4:06
#2 楼
是否有任何技术原因限制唤醒词的自定义
当不使用辅助设备时,应用处理器(我认为ARM是Alexa以及Google Home) )处于暂停状态,并进入可能的最低功耗状态。唤醒字检测留给非常省电的DSP,DSP会监听环境噪声/声音并运行算法来确定是否与唤醒字匹配。如果找到具有足够置信度的匹配项,DSP就会唤醒ARM内核以继续进行其余的处理。
现在,由于目标是提高功率效率,因此有问题的DSP将算法运行为以及将模板模式存储在片上存储器而不是主板上RAM中。这使系统甚至可以将DDR RAM置于最低功耗状态。
由于DSP有许多关键工作要做,而且片上存储器很少,因此辅助唤醒字仅限于少数几个最佳选择。该算法可以高度自信地匹配该算法。
评论
要记住的一件事是,要唤醒的处理必须在低功耗,始终在线的域中完成-在某些较大的SoC(尤其是电话中使用的SoC)中,通常有专门的硬件可用于此任务,我假设滤波器系数/其他参数是经过仔细计算的,并已加载到该硬件中。我忘记了运行哪个SoC Echo,但我想这里有一个类似的过滤器。算法类的名称此刻正在逃避我