深度自编码网络特征提取实现基于超声的无声语音识别

摘要	第4-5页
ABSTRACT	第5页
第1章绪论	第8-12页
1.1 课题背景	第8-9页
1.2 研究现状	第9-10页
1.3 论文创新工作	第10页
1.4 论文结构	第10-12页
第2章相关背景综述	第12-26页
2.1 无声语音接口	第12-14页
2.1.1 电磁发音仪EMA	第12-13页
2.1.2 表面肌电信号传感器surface EMG（sEMG）	第13-14页
2.1.3 超声和光学成像	第14页
2.2 语音识别	第14-19页
2.2.1 语音识别的历史和发展现状	第14-16页
2.2.2 语音识别过程	第16-19页
2.3 深度神经网络（DNN）	第19-23页
2.3.1 神经网络的历史和发展现状	第19-21页
2.3.2 DNN在语音识别中的应用	第21-23页
2.4 本章小结	第23-26页
第3章无声语音识别系统	第26-44页
3.1 数据采集	第26-32页
3.1.1 图像数据采集设备简介	第26-30页
3.1.2 TIMIT语料库	第30-31页
3.1.3 数据采集规则	第31-32页
3.2 非声学特征提取	第32-41页
3.2.1 图像特征提取方法简介	第32-36页
3.2.2 基于自编码网络的特征提取	第36-41页
3.3 无声语音识别	第41-42页
3.4 本章小结	第42-44页
第4章实验与分析	第44-58页
4.1 数据集	第44页
4.2 特征提取	第44-49页
4.2.1 图像预处理	第45页
4.2.2 DAE网络训练	第45-47页
4.2.3 结果及分析	第47-49页
4.3 无声语音识别	第49-55页
4.3.1 Kaldi语音识别工具箱	第49页
4.3.2 数据准备	第49-51页
4.3.3 DNN-HMM训练	第51-53页
4.3.4 识别结果分析	第53-55页
4.4 本章小结	第55-58页
第5章网络参数对模型训练的影响	第58-64页
5.1 DAE训练迭代次数对图像重构的影响	第58-60页
5.2 高斯数对单音素模型的影响	第60-61页
5.3 回归树叶节点数和高斯数对三音素模型的影响	第61-62页
5.4 DNN训练层数和隐层节点数对识别结果的影响	第62-63页
5.5 本章小结	第63-64页
第6章总结与展望	第64-66页
6.1 总结	第64-65页
6.2 展望	第65-66页
参考文献	第66-70页
发表论文和参加科研情况说明	第70-72页
致谢	第72-73页