科学视点

声学所将可控制残差噪声的语音增强方法用于语音通讯

  在抑制背景噪声的同时避免引入不自然的失真是语音通讯中的重要课题。目前,基于深度学习的语音增强方法能够有效减少背景噪声成分,但会在噪声失配条件下会引入较多不自然的残差噪声,对语音舒适度造成影响。

  近日,中国科学院噪声与振动重点实验室研究生李安冬及其导师郑成诗等提出一种带有残差噪声控制的语音增强方法用于语音通讯,在人为保留较低背景噪声的前提下,以噪声抑制与语音失真最小化为目标进行联合优化,提高语音舒适度。

  该研究通过引入多个可调节参数推导出一种广义损失函数,用不同参数组合使增强后的语音进行有效权衡,并通过人为引入较低的背景噪声参与优化有效增强语音的主观听觉质量。实验结果表明,选择合理的参数组合,可使增强后的语音在客观指标与主观评估结果上优于以往的处理结果。许多常用的损失函数均可被视为这种广义损失函数的特殊情况,并用上述方法进行优化。

  相关成果发表于Applied Sciences。研究得到国家自然科学基金资助。

  论文链接

不同参数组合的客观指标对比


分享到:

微信图片_20180628014711.jpg

  官方微信