外媒：重新考虑消费者语音技术的用户界面

语音能够供应简洁、惹人饮茶注目的用户体验，然则将语音控件添加到任何产物、办事或应用法式的路径都是复杂的。跟着占主导地位的科技公司持续斥地支撑语音的界面和助手，产物设计师、斥地人员和制造商将被迫从新考虑用户体验和用户界面。

跟着智能音箱应用的惊人扩展，以及消费者将智能家居设备作为点解决方案而非系统购置的趋势，将来很多家庭将拥有一个以语音掌握为首要用户界面的分布式智能..。

在2019岁首，36%的美国宽带家庭拥有至少一个带有语音助手的智能扬声器。

语音助手手艺依靠于两个首要组件：硬件，一种通信和捕捉号令的体式;还有软件，一种思虑和处理回响的体式。固然硬件和软件决议很主要，然则考虑其他身分——好比内陆处理和云处理，以及功耗——也会对语音优先应用法式或设备的成功发生重大影响。

硬件设计

语音设计要求制造商评估他们的最终产物，并就使用情况、设备将被使用的情况和消费者交互模型做出决议。这些决议影响硬件选择。

例如，对设备情况的评估，包罗空间感知、房间中潜在的噪音水平，以及用户说话时与设备的距离，或者会导致麦克风的使用或多或少。

要实现语音识别，设备必需联网，并包罗麦克风和扬声器。其他组件包罗模数转换器(ADC)、数字旌旗处理器(DSP)和数字模拟转换器(DAC)。

在输入阶段，当用户对设备说话时，麦克风将捕获短语并将其发送到ADC, ADC将语音输入转换为数字音频数据。麦克风能够是模拟的，也能够是数字的。模拟麦克风必需与模拟-数字转换器配对，而数字麦克风有一个内置。

麦克风阵列的设计取决于设备的情况。对于那些需要用户近距离说话的设备，一到两个麦克风是幻想的。远场通信或者需要4到7个麦克风阵列。

输入阶段之后是处理阶段。数字旌旗处理器将数据输入收集模块和天然说话处理引擎。在此阶段，将对捕捉的语音数据引入算法。

波束形成、动态局限压缩和自适应频谱降噪等算法有助于提高所捕捉语音数据的质量。处理完成后，将数据发送到数模转换器和放大器，输出给用户。

软件需求

为语音优先手艺建立软件根蒂举措的构件包罗天然说话处理，个中包罗主动语音识别(ASR)和天然说话懂得(NLU)；叫醒词算法，启动语音响应过程；以及一个处理数据的云..。

wake word作为用户和语音助手之间的网关。wake word引擎是一种算法，它经由监测音频旌旗来检测感乐趣的特定单词，从而激活设备的语音界面。

一旦预先确定的触发词或短语被检测到，语音查询就被发送到云长进行处理。平日，该手艺在内陆设备上运行，以提高语音查询响应的延迟，并珍爱隐私。

天然说话处理(NLP)是人工智能的一种形式，经由文本、语音或两者的天然对话实现人机交互。聊天机械人平日指基于文本的对话系统，而语音机械人则指Alexa或谷歌Assistant等语音优先助手。

在一个简化的NLP系统构造中，主动语音识别(ASR)识别说话的单词并将它们转换为文本(语音到文本)。

内陆处理与云处理

追求为语音优先手艺设计的公司必需决意他们的语音助手将若何处理语音查询——无论是在云端照样在内陆设备上。考虑响应速度、Internet保持和平安性都是决议的考虑身分。

语音芯片制造商DSP Group发现，在相当低端的处理器或DSP芯片上实现必然数量的简洁号令是可行的。它发现，内陆简洁号令数量的最佳点是5到10个号令。

这些号令包罗诸如打开和封闭设备、降低和增加音量等义务。一旦号令数量跨越10到15个，对内存和处理能力的需求就会增加，故障检测率提高的风险也会大大增加。

这表明向云处理的改变。更复杂的号令被发送到云，因为需要更多的功能和天真性，而有限的号令子集能够在内陆注释。

一向在线监听设备的隐私问题是采用语音优先设备的一个要害障碍。此外，消费者对设备制造商在接见和治理他们的小我数据方面缺乏信任。

电源输入/消费

制造商必需考虑运行天然说话处理算法的处理器的功耗。缺乏专用电源的设备能够从低能耗解决方案中获益。与支撑语音的设备相关系的始终在线监听功能的电源感知设计是电源优化的要害。

今朝的智能音箱都采用了交流电源，这是因为一向监听手艺的能源消费。公司选择电池供电而不是交流电的原因有好多，好比设备的物理位置，以及设备在房间里摆放的自由。

美观也或者是移除设备电源线的一个身分，稀奇是对于那些在实现语音识别手艺之前一向使用电池供电的设备。

语音电视遥控器是由电池供电的设备，要求消费者每三到四个月更调一次电池。康卡斯特(Comcast)等一些公司选择了“一键通”(push-to-talk)功能，而不是免提语音遥控器，以耽误电池寿命。

电能消费能够经由多种体式来实现。削减功耗能够经由使用奇特的尾流字手艺、集成语音号令的数量和在设备上启动的算法来实现。

跟着消费电子行业持续索求在小型设备和形式身分的语音接口，对超高效和低功耗解决方案的需求将会增加。

跟着智能家居设备拥有量的增加，用户往往拥有多个设备，语音作为家庭的集顶用户界面将变得越来越主要。互把持性是一个驱动身分。语音将成为缓解智能家居复杂性和碎片化的要害接口。