首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于深度学习的中文儿童语音识别声学模型研究

摘要第9-10页
Abstract第10-11页
第1章 绪论第14-20页
    1.1 研究背景及意义第14页
    1.2 研究现状第14-18页
        1.2.1 语音识别的研究现状第14-16页
        1.2.2 儿童语音识别的研究现状第16-18页
    1.3 研究内容及组织结构第18-20页
        1.3.1 本文研究内容第18页
        1.3.2 本文组织结构第18-20页
第2章 语音信号的分析及处理第20-30页
    2.1 语音信号模型第20-22页
        2.1.1 激励模型第20-21页
        2.1.2 声道模型第21-22页
        2.1.3 辐射模型第22页
    2.2 语音信号的预处理第22-27页
        2.2.1 采样与量化第23页
        2.2.2 预加重第23-24页
        2.2.3 分帧与加窗第24-25页
        2.2.4 端点检测第25-27页
    2.3 语音特征第27-29页
        2.3.1 Fbank特征提取第27-29页
        2.3.2 MFCC特征提取第29页
        2.3.3 动态差分特征计算第29页
    2.4 本章小节第29-30页
第3章 中文儿童语音识别基线系统第30-39页
    3.1 中文儿童语音识别系统组成第30-31页
    3.2 声学模型第31-34页
        3.2.1 基于GMM-HMM的声学模型第31-33页
        3.2.2 基于DNN-HMM声学模型第33-34页
    3.3 语言模型第34-35页
    3.4 中文儿童语音识别基元第35页
    3.5 语音解码器第35-36页
    3.6 实验相关配置说明第36-37页
    3.7 中文儿童语音识别基线模型第37-38页
    3.8 本章小节第38-39页
第4章 基于CNN-TDNN-OPGRU的儿童声学模型第39-49页
    4.1 卷积神经网络第39-40页
    4.2 时延神经网络第40页
    4.3 递归神经网络第40-41页
    4.4 门控神经网络第41-42页
    4.5 CNN-TDNN-OPGRU声学模型第42-44页
    4.6 实验结果及分析第44-48页
        4.6.1 TDNN实验结果第44-45页
        4.6.2 LSTM实验结果第45页
        4.6.3 TDNN-LSTM实验结果第45-47页
        4.6.4 CNN-TDNN-OPGRU实验结果第47-48页
    4.7 本章小节第48-49页
第5章 基于MTL-DFSMN的儿童声学模型第49-61页
    5.1 前馈序列记忆神经网络第49-53页
        5.1.1 标准前馈序列记忆神经网络第49-51页
        5.1.2 简约前馈序列记忆神经网络第51-52页
        5.1.3 深层前馈序列记忆神经网络第52-53页
    5.2 多任务学习第53-55页
        5.2.1 多任务学习原理第53-54页
        5.2.2 基于多任务的DFSMN声学模型第54-55页
    5.3 实验结果及分析第55-60页
        5.3.1 基线说明第55-56页
        5.3.2 FSMN实验结果第56-57页
        5.3.3 cFSMN实验结果第57-58页
        5.3.4 DFSMN实验结果第58-59页
        5.3.5 基于多任务的DFSMN实验结果第59页
        5.3.6 各声学模型的结果对比第59-60页
    5.4 本章小节第60-61页
总结与展望第61-63页
参考文献第63-69页
致谢第69-70页
附录 A 攻读学位期间所发表的学术论文目录第70页

论文共70页,点击 下载论文
上一篇:基于SAE多特征融合的静态手势识别方法研究
下一篇:复杂场景下鲁棒跟踪与超分辨率重建算法研究