智能语音技术中麦克风阵列的原理(2)

2018-07-09 03:57:02 网络整理阅读：84 评论：0

说话人老是变幻位置怎么破?—声源定位

现实中，声源的位置是不断变化的，这对于麦克风收音来说，是个障碍。麦克风阵列则可以进行声源定位，声源定位技术是指使用麦克风阵列来计算目标说话人的角度和距离，从而实现对目标说话人的跟踪以及后续的语音定向拾取，，是人机交互、音视频会议等领域非常重要的前处理技术。所以麦克风阵列技术不限制说话人的运动，不需要移动位置以改变其接收方向，具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点，因而成为智能语音处理系统中捕捉说话人语音的重要手段。

室内回声太大怎么破?—去混响

一般我们听音乐时，希望有混响的效果，这是听觉上的一种享受。合适的混响会使得声音圆润动听、富有感染力。混响(Reverberation)现象指的是声波在室内传播时，要被墙壁、天花板、地板等障碍物形成反射声，并和直达声形成叠加，这种现象称为混响。

但是，混响现象对于识别就没有什么好处了。由于混响则会使得不同步的语音相互叠加，带来了音素的交叠掩蔽效应(Phoneme Overlap Effect)，从而严重影响语音识别效果。

影响语音识别的部分一般是晚期混响部分，所以去混响的主要工作重点是放在如何去除晚期混响上面，多年来，去混响技术抑制是业界研究的热点和难点。利用麦克风阵列去混响的主要方法有以下几种：

1、基于盲语音增强的方法(Blind signal enhancement approach)，即将混响信号作为普通的加性噪声信号，在这个上面应用语音增强算法。

2、基于波束形成的方法(Beamforming based approach)，通过将多麦克风对收集的信号进行加权相加，在目标信号的方向形成一个拾音波束，同时衰减来自其他方向的反射声。

智能语音技术中麦克风阵列的原理(2)

相关文章

热点文章

推荐文章