声学所提出一体化降噪与混响消除算法

2020-11-23新闻15

当环境中存在噪声或混响干扰时，传统的降噪算法或解混响算法可有效抑制相应的干扰，但当这两种干扰同时存在时，这些算法的性能明显下降，从而导致语音通信的质量与自动语音识别系统的准确率降低。

为了同时抑制环境中存在的噪声与混响，中国科学院声学研究所语言声学与内容理解重点实验室的硕士生宋思远与其导师、研究员李军锋等，提出一种融合多通道加权预测误差与多通道维纳滤波的一体化降噪与解混响算法。相关研究成果以An integrated multi-channel approach for joint noise reduction and dereverberation为题，在线发表在Applied Acoustics上。

研究人员用加入单通道维纳后滤波的最小方差无失真响应（Minimum Variance Distortionless Response, MVDR）波束形成器实现了多通道维纳滤波器，其输入为加权预测误差（Weighted Predict Error, WPE）预处理器的输出信号。他们采用相对早期传递函数，而非整个相对传递函数或直达声信号，来实现MVDR波束形成器，并使用WPE的预测对干扰信号的协方差矩阵进行近似计算；随后根据整个系统的输出信号，更新WPE中的目标信号方差。模拟和真实条件下的实验结果表明，在噪声与混响同时存在的环境下，该方法可对语音进行有效地增强处理。当麦克风与声源距离为3米时，算法处理后的语音识别词错率降低38.50％。研究人员将该方法与五种最近被提出的相关算法进行对比，结果表明，新算法在语音质量、语音清晰度和语音识别性能等方面优于其他算法。

当环境中存在噪声与混响时，该研究在较大程度上提升了语音通信系统与自动语音识别系统的用户体验。研究工作获得国家重点研发计划和国家自然科学基金的资助。