语音增强算法的研究及应用

【摘要】：现代生活中,噪声无处不在,语音信号在其采集、传输过程,无法避免地会受到来自周围环境和传输媒介、通信设备内部,以及说话人自身的噪声干扰。这些干扰将会严重影响语音的接收和应用。为了提升语音信号的可应用性,最大程度的恢复纯净的原始信号,去除噪声成分就成了语音信号应用前期的关键环节。语音增强就是针对带噪语音进行的处理,目的是改善语音的质量,提升语音的清晰度、可懂度以及舒适度,并且提高语音信号应用系统的性能。因此,语音增强算法的研究有着非常广泛的应用价值。本文针对被噪声污染的语音信号增强处理这一问题,从增强算法的灵活性,适应性以及实用性三个方面考虑,探寻一种行之有效的算法,有效的改善了不同噪声环境下带噪信号的增强效果。本文围绕这一研究目标,主要进行以下的研究工作:首先,在对语音信号进行预加重、加窗分帧以及短时分析的基础上,充分分析了语音信号以及噪声信号的短时特征差异。利用二者的差异,通过双门限法实现了语音信号的活性检测。其次,在基本谱减法原理基础上,引进被减项权值处理与功率谱修正处理;以增强后语音信号的信噪比为输出,以变化的谱减功率系数和谱减噪声系数为输入,自动控制选择最优参数,并且将其与带噪语音输入信噪比相匹配。对信号进行语音增强时,通过计算其输入信噪比,利用最优参数曲线得到最优参数值,然后结合平滑处理的过程实现语音增强最大化。仿真试验验证了本文算法的优越性。最后,将改进后的语音增强算法应用于机器人声源定位系统中。选取正四面体声源麦克风阵列,建立声源定位模型。通过对定位模型进行分析,确定时延估计精度的重要性。最后通过仿真和实验,验证了本文语音增强算法对于声源定位系统中时延估计精度的提高,以及定位精度的提升。
【关键词】：语音增强 谱减法 最优参数 声源定位 时延估计
【学位级别】：硕士
【学位授予年份】：2015
【分类号】：TN912.35