基于波束形成与DNN的远距离语音识别方法研究

摘要	第5-6页
Abstract	第6页
1 绪论	第9-13页
1.1 课题研究背景及意义	第9-10页
1.2 语音识别的研究现状	第10-12页
1.3 论文主要工作及内容安排	第12-13页
2 远距离语音识别基本理论	第13-29页
2.1 引言	第13页
2.2 麦克风阵列	第13-17页
2.2.1 麦克风阵列拓扑结构	第14页
2.2.2 波束形成	第14-17页
2.3 语音信号特征提取	第17-19页
2.4 基于深度神经网络的声学模型	第19-23页
2.4.1 DNN-HMM声学模型	第19-21页
2.4.2 端到端声学模型	第21-23页
2.5 语言模型与解码方法	第23-28页
2.5.1 N元语言模型	第24页
2.5.2 基于WFST的语音识别	第24-25页
2.5.3 维特比算法	第25-26页
2.5.4 Beam搜索算法	第26-27页
2.5.5 解码词网格	第27-28页
2.6 本章小结	第28-29页
3 基于改进BFDNN的远距离语音识别方法	第29-42页
3.1 引言	第29页
3.2 算法原理	第29-37页
3.2.1 多通道互相关系数信息提取	第30-31页
3.2.2 均匀圆阵	第31-32页
3.2.3 MVDR波束形成器	第32-34页
3.2.4 联合DNN的波束形成器空间权重的估计	第34-35页
3.2.5 系统训练与解码	第35-37页
3.3 仿真实验结果和分析	第37-41页
3.3.1 实验环境与参数设置	第37页
3.3.2 仿真结果与分析	第37-41页
3.4 本章小结	第41-42页
4 基于反馈增强网络的远距离语音识别方法	第42-53页
4.1 引言	第42页
4.2 算法原理	第42-48页
4.2.1 注意力机制网络结构	第43-44页
4.2.2 语音增强DNN与注意力机制联合系统	第44-46页
4.2.3 联合系统训练与解码	第46-48页
4.3 仿真实验结果和分析	第48-52页
4.3.1 实验环境与参数设置	第48-49页
4.3.2 仿真结果与分析	第49-52页
4.4 本章小结	第52-53页
5 总结与展望	第53-55页
参考文献	第55-58页
攻读硕士期间发表学术论文情况	第58-59页
致谢	第59页