首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于序列记忆神经网络的藏语声学建模方法研究

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第14-26页
    1.1 研究背景第14页
    1.2 语音识别第14-22页
        1.2.1 语音识别的基本概念第14-17页
        1.2.2 语音识别的发展历程第17-18页
        1.2.3 基于深度学习的声学建模第18-21页
        1.2.4 语音识别仍存在的问题第21-22页
    1.3 藏语语音识别研究现状第22-23页
    1.4 本文研究目标和研究内容第23-24页
    1.5 本文结构安排第24-26页
第2章 基于隐马尔科夫模型的藏语声学建模第26-34页
    2.1 引言第26页
    2.2 隐马尔科夫模型第26-28页
    2.3 基于GMM-HMM的声学建模第28-30页
    2.4 基于深度学习的声学建模第30-31页
    2.5 实验第31-33页
    2.6 本章小结第33-34页
第3章 基于CTC技术的藏语声学建模第34-48页
    3.1 引言第34-35页
    3.2 基于链接时序分类技术的语音识别第35-41页
        3.2.1 CTC准则的原理第35-39页
        3.2.2 CTC准则与CE准则的区别第39-40页
        3.2.3 建模单元的选择第40-41页
    3.3 藏汉双语混合声学建模第41-42页
    3.4 实验第42-47页
        3.4.1 基于CTC技术的藏语声学建模第42-44页
        3.4.2 藏汉双语混合声学建模第44-47页
    3.5 本章小结第47-48页
第4章 基于多任务学习的藏语CTC声学建模第48-58页
    4.1 引言第48-49页
    4.2 多任务学习简介第49-51页
        4.2.1 多任务学习的定义第49-50页
        4.2.2 多任务学习与迁移学习第50页
        4.2.3 多任务学习的有效性第50-51页
    4.3 多任务学习、端到端方法以及交叉熵方法混合训练第51-53页
    4.4 实验第53-55页
    4.5 本章小结第55-58页
第5章 基于前馈序列记忆网络的藏语CTC声学建模加速第58-68页
    5.1 引言第58-59页
    5.2 FSMN-CTC声学模型第59-63页
    5.3 实验第63-65页
    5.4 本章小结第65-68页
第6章 总结与展望第68-70页
    6.1 本文总结第68-69页
    6.2 后续相关工作第69-70页
参考文献第70-80页
致谢第80-82页
在读期间发表的学术论文与取得的研究成果第82页

论文共82页,点击 下载论文
上一篇:基于不完整临界多边形的二维排样问题的研究
下一篇:广义半马尔可夫跳跃系统的饱和控制