基于序列记忆神经网络的藏语声学建模方法研究

摘要	第5-7页
ABSTRACT	第7-8页
第1章绪论	第14-26页
1.1 研究背景	第14页
1.2 语音识别	第14-22页
1.2.1 语音识别的基本概念	第14-17页
1.2.2 语音识别的发展历程	第17-18页
1.2.3 基于深度学习的声学建模	第18-21页
1.2.4 语音识别仍存在的问题	第21-22页
1.3 藏语语音识别研究现状	第22-23页
1.4 本文研究目标和研究内容	第23-24页
1.5 本文结构安排	第24-26页
第2章基于隐马尔科夫模型的藏语声学建模	第26-34页
2.1 引言	第26页
2.2 隐马尔科夫模型	第26-28页
2.3 基于GMM-HMM的声学建模	第28-30页
2.4 基于深度学习的声学建模	第30-31页
2.5 实验	第31-33页
2.6 本章小结	第33-34页
第3章基于CTC技术的藏语声学建模	第34-48页
3.1 引言	第34-35页
3.2 基于链接时序分类技术的语音识别	第35-41页
3.2.1 CTC准则的原理	第35-39页
3.2.2 CTC准则与CE准则的区别	第39-40页
3.2.3 建模单元的选择	第40-41页
3.3 藏汉双语混合声学建模	第41-42页
3.4 实验	第42-47页
3.4.1 基于CTC技术的藏语声学建模	第42-44页
3.4.2 藏汉双语混合声学建模	第44-47页
3.5 本章小结	第47-48页
第4章基于多任务学习的藏语CTC声学建模	第48-58页
4.1 引言	第48-49页
4.2 多任务学习简介	第49-51页
4.2.1 多任务学习的定义	第49-50页
4.2.2 多任务学习与迁移学习	第50页
4.2.3 多任务学习的有效性	第50-51页
4.3 多任务学习、端到端方法以及交叉熵方法混合训练	第51-53页
4.4 实验	第53-55页
4.5 本章小结	第55-58页
第5章基于前馈序列记忆网络的藏语CTC声学建模加速	第58-68页
5.1 引言	第58-59页
5.2 FSMN-CTC声学模型	第59-63页
5.3 实验	第63-65页
5.4 本章小结	第65-68页
第6章总结与展望	第68-70页
6.1 本文总结	第68-69页
6.2 后续相关工作	第69-70页
参考文献	第70-80页
致谢	第80-82页
在读期间发表的学术论文与取得的研究成果	第82页