首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于深度学习的蒙古语语音识别声学模型研究

摘要第3-5页
ABSTRACT第5-6页
第一章 引言第12-17页
    1.1 研究背景及意义第12-13页
    1.2 相关研究工作第13-15页
        1.2.1 语音识别发展历史和研究现状第13-14页
        1.2.2 蒙古语语音识别研究现状第14-15页
    1.3 论文主要研究内容及组织结构第15-17页
        1.3.1 研究内容第15页
        1.3.2 组织结构第15-17页
第二章 蒙古语语音识别原理第17-31页
    2.1 蒙古语语音识别系统结构第17-18页
    2.2 蒙古语语音特征提取第18-19页
    2.3 声学模型第19-23页
        2.3.1 基于GMM-HMM的声学模型第19-21页
        2.3.2 基于DNN-HMM的声学模型第21-23页
    2.4 词典与语言模型第23-24页
    2.5 解码器第24-25页
    2.6 蒙古语语音识别基线系统第25-30页
        2.6.1 前馈全连接神经网络第25-27页
        2.6.2 实验数据准备第27-28页
        2.6.3 蒙古语语音识别系统建立及评测第28-29页
        2.6.4 基线模型实验第29-30页
    2.7 本章小结第30-31页
第三章 基于TDNN-FSMN混合模型的声学建模第31-45页
    3.1 时延神经网络第31-32页
        3.1.1 TDNN网络结构第31-32页
        3.1.2 TDNN子采样第32页
    3.2 前馈序列记忆神经网络第32-34页
    3.3 链式模型第34-36页
        3.3.1 最大互信息区分性训练第34-35页
        3.3.2 去网格最大互信息训练第35-36页
    3.4 TDNN-FSMN混合模型第36-38页
        3.4.1 网络结构第36-37页
        3.4.2 模型分析第37-38页
    3.5 实验结果与分析第38-44页
        3.5.1 TDNN模型实验第39-40页
        3.5.2 FSMN模型实验第40-41页
        3.5.3 链式模型实验第41页
        3.5.4 TDNN-FSMN模型实验第41-44页
    3.6 本章小结第44-45页
第四章 基于AM-TDNN-LSTM混合模型的声学建模第45-58页
    4.1 长短时记忆神经网络第45-47页
    4.2 TDNN-LSTM混合模型第47-48页
    4.3 注意力机制第48-50页
        4.3.1 算法描述第48-49页
        4.3.2 自注意力机制第49-50页
    4.4 实验结果与分析第50-57页
        4.4.1 LSTM模型实验第51-52页
        4.4.2 TDNN-LSTM模型实验第52-54页
        4.4.3 AM-TDNN-LSTM模型实验第54-57页
    4.5 本章小结第57-58页
第五章 总结及展望第58-60页
    5.1 本文工作总结第58-59页
    5.2 后续工作展望第59-60页
参考文献第60-64页
致谢第64-65页
攻读硕士期间发表的学术论文第65页

论文共65页,点击 下载论文
上一篇:面向农牧区内容分发的延迟容忍网络密钥管理方案研究
下一篇:基于神经网络的多通道语音端点检测方法研究