首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于深度学习的语音情感识别研究

中文摘要第3-4页
英文摘要第4页
1 绪论第7-12页
    1.1 研究背景及意义第7-8页
    1.2 语音情感识别国内外研究历史、现状及挑战第8-10页
    1.3 本文的主要贡献第10页
    1.4 论文组织结构第10-12页
2 语音情感识别相关研究基础第12-30页
    2.1 情感的定义及分类第12-15页
        2.1.1 情感的定义第12页
        2.1.2 情感的分类第12-15页
    2.2 具有代表性的情感语音库第15-16页
        2.2.1 离散情感数据库第15-16页
        2.2.2 维度情感数据库第16页
    2.3 语音信号预处理第16-17页
    2.4 常见的语音情感特征第17-19页
        2.4.1 韵律学特征第17-18页
        2.4.2 基于谱的相关特征第18页
        2.4.3 声音质量特征第18-19页
        2.4.4 融合特征第19页
        2.4.5 基于i-vector的特征第19页
    2.5 常见的语音情感识别算法第19-29页
        2.5.1 基于传统机器学习的语音情感识别算法第19-24页
        2.5.2 基于深度学习的语音情感识别算法第24-29页
    2.6 本章小结第29-30页
3 基于EMNet的语音情感识别第30-46页
    3.1 语谱图第30-31页
    3.2 卷积神经网络基本原理第31-35页
        3.2.1 局部感知域第31-32页
        3.2.2 参数共享第32-33页
        3.2.3 多卷积核第33-34页
        3.2.4 下采样(Down-pooling)第34-35页
    3.3 CNN的前向和反向传播过程第35-37页
        3.3.1 CNN的前向传播过程第35-36页
        3.3.2 CNN的反向传播过程第36-37页
    3.4 实验环境及数据集第37-39页
        3.4.1 实验环境第37页
        3.4.2 实验数据集第37-39页
    3.5 实验过程与结果第39-43页
        3.5.1 基于AlexNet的语音情感识别实验第39-41页
        3.5.2 基于EMNet的语音情感识别实验第41-43页
    3.6 AlexNet和EMNet的模型复杂度分析第43-45页
        3.6.1 AlexNet模型的复杂度分析第43-44页
        3.6.2 EMNet模型的复杂度分析第44-45页
    3.7 本章小结第45-46页
4 DPARIP与CNN相结合的语音情感识别算法第46-58页
    4.1 视网膜及凸透镜成像原理第46-48页
    4.2 基于视网膜成像原理的数据处理算法DPARIP第48-52页
    4.3 实验环境及数据集第52-53页
        4.3.1 实验环境第52页
        4.3.2 实验数据集第52-53页
    4.4 实验过程与结果第53-56页
    4.5 实验分析第56页
    4.6 本章小结第56-58页
5 总结与展望第58-59页
    5.1 全文总结第58页
    5.2 未来工作展望第58-59页
致谢第59-60页
参考文献第60-68页
附录第68页
    A.作者在攻读学位期间发表的论文目录第68页

论文共68页,点击 下载论文
上一篇:气门嘴芯自动组装线智能控制与监测系统研究与设计
下一篇:基于卷积神经网络的不同口音对话自适应识别研究