基于深度学习的蒙古语语音识别声学模型研究

摘要	第3-5页
ABSTRACT	第5-6页
第一章引言	第12-17页
1.1 研究背景及意义	第12-13页
1.2 相关研究工作	第13-15页
1.2.1 语音识别发展历史和研究现状	第13-14页
1.2.2 蒙古语语音识别研究现状	第14-15页
1.3 论文主要研究内容及组织结构	第15-17页
1.3.1 研究内容	第15页
1.3.2 组织结构	第15-17页
第二章蒙古语语音识别原理	第17-31页
2.1 蒙古语语音识别系统结构	第17-18页
2.2 蒙古语语音特征提取	第18-19页
2.3 声学模型	第19-23页
2.3.1 基于GMM-HMM的声学模型	第19-21页
2.3.2 基于DNN-HMM的声学模型	第21-23页
2.4 词典与语言模型	第23-24页
2.5 解码器	第24-25页
2.6 蒙古语语音识别基线系统	第25-30页
2.6.1 前馈全连接神经网络	第25-27页
2.6.2 实验数据准备	第27-28页
2.6.3 蒙古语语音识别系统建立及评测	第28-29页
2.6.4 基线模型实验	第29-30页
2.7 本章小结	第30-31页
第三章基于TDNN-FSMN混合模型的声学建模	第31-45页
3.1 时延神经网络	第31-32页
3.1.1 TDNN网络结构	第31-32页
3.1.2 TDNN子采样	第32页
3.2 前馈序列记忆神经网络	第32-34页
3.3 链式模型	第34-36页
3.3.1 最大互信息区分性训练	第34-35页
3.3.2 去网格最大互信息训练	第35-36页
3.4 TDNN-FSMN混合模型	第36-38页
3.4.1 网络结构	第36-37页
3.4.2 模型分析	第37-38页
3.5 实验结果与分析	第38-44页
3.5.1 TDNN模型实验	第39-40页
3.5.2 FSMN模型实验	第40-41页
3.5.3 链式模型实验	第41页
3.5.4 TDNN-FSMN模型实验	第41-44页
3.6 本章小结	第44-45页
第四章基于AM-TDNN-LSTM混合模型的声学建模	第45-58页
4.1 长短时记忆神经网络	第45-47页
4.2 TDNN-LSTM混合模型	第47-48页
4.3 注意力机制	第48-50页
4.3.1 算法描述	第48-49页
4.3.2 自注意力机制	第49-50页
4.4 实验结果与分析	第50-57页
4.4.1 LSTM模型实验	第51-52页
4.4.2 TDNN-LSTM模型实验	第52-54页
4.4.3 AM-TDNN-LSTM模型实验	第54-57页
4.5 本章小结	第57-58页
第五章总结及展望	第58-60页
5.1 本文工作总结	第58-59页
5.2 后续工作展望	第59-60页
参考文献	第60-64页
致谢	第64-65页
攻读硕士期间发表的学术论文	第65页