首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于深度学习的语音情感识别方法的研究

摘要第5-6页
Abstract第6页
第一章 绪论第12-20页
    1.1 研究背景与意义第12页
    1.2 研究历史与现状第12-17页
        1.2.1 情感描述模型第13-14页
        1.2.2 语音情感数据库第14-15页
        1.2.3 语音情感特征第15页
        1.2.4 语音情感分类算法第15-17页
    1.3 本文的主要工作及章节结构第17-20页
第二章 语音情感数据库建立以及特征集提取第20-28页
    2.1 语音情感库的建立第20页
    2.2 语音情感信号的预处理第20-22页
        2.2.1 预加重第20-21页
        2.2.2 加窗分帧第21页
        2.2.3 端点检测第21-22页
    2.3 语音情感特征参数的提取与分析第22-25页
        2.3.1 语音帧能量第22页
        2.3.2 短时过零率第22-23页
        2.3.3 基音频率第23页
        2.3.4 26-band Mel-Spectrum第23页
        2.3.5 Mel Frequency Ceptrum Coefficient(MFCC)第23-24页
        2.3.6 频谱特征第24-25页
    2.4 语谱图特征第25页
        2.4.1 语谱图产生原理第25页
    2.5 语音情感特征向量归一化第25-26页
    2.6 本章小结第26-28页
第三章 基于Stacked Denoising AutoEncoder的语音情感识别第28-42页
    3.1 深度学习理论基础第28-31页
        3.1.1 人工神经网络第28-29页
        3.1.2 Softmax回归第29-31页
    3.2 栈式带噪自编码神经网络第31-33页
        3.2.1 稀疏自编码(Sparse Autoencoder)第31-32页
        3.2.2 栈式自编码器第32页
        3.2.3 栈式带噪自编码神经网络第32-33页
    3.3 微调(fine-tuning)栈式自编码网络第33页
        3.3.1 基本策略第33页
        3.3.2 理论推导第33页
    3.4 基于带噪自编码神经网络(SDA)的语音情感识别算法研究第33-36页
        3.4.1 SDA降维第33-34页
        3.4.2 SDA情感相关特征提取第34-35页
        3.4.3 SDA Cepstrum Coefficient (SDACC)第35-36页
    3.5 实验第36-40页
        3.5.1 实验情感特征集合第36-37页
        3.5.2 SDA降维在情感识别中的使用第37-38页
        3.5.3 DD-AEF特征情感识别实验第38-39页
        3.5.4 SDACC语音情感识别实验第39-40页
    3.6 本章小结第40-42页
第四章 基于卷积神经网络的语音情感识别第42-52页
    4.1 CNN基本原理第42-45页
        4.1.1 稀疏连接第42页
        4.1.2 权值共享第42-43页
        4.1.3 卷积和池化第43-45页
    4.2 基于CNN的语音情感识别算法研究第45-46页
        4.2.1 语谱图规范化第45-46页
    4.3 改进的情感识别卷积神经网络第46-47页
        4.3.1 多种大小卷积核CNN第46页
        4.3.2 瓶颈特征提取CNN第46-47页
    4.4 实验第47-50页
        4.4.1 语谱图预处理方式对比试验第47-48页
        4.4.2 多种卷积结构对比试验第48-49页
        4.4.3 卷积瓶颈特征(CNN-BN)分析实验第49-50页
    4.5 本章小结第50-52页
第五章 基于深度置信网络的语音情感识别第52-64页
    5.1 能量模型第52-53页
    5.2 限制玻尔兹曼机第53-56页
        5.2.1 RBM原理第53-54页
        5.2.2 吉布斯采样第54-55页
        5.2.3 对比散度学习(Contrastive Divergence)第55-56页
    5.3 深度置信网(Deep Belief Network (DBN))第56-57页
    5.4 基于DBN的语音情感识别研究第57-58页
        5.4.1 DBN降维模型第57页
        5.4.2 DBN Cepstrum Coefficient(DBNCC)第57-58页
    5.5 实验第58-62页
        5.5.1 DBN降维实验第58-60页
        5.5.2 DBNCC语音情感识别实验第60-62页
    5.6 本章小结第62-64页
第六章 总结与展望第64-66页
    6.1 总结第64页
    6.2 展望第64-66页
致谢第66-68页
参考文献第68-72页
攻读硕士学位期间发表的论文第72页

论文共72页,点击 下载论文
上一篇:数字助听器的自适应验配技术的研究
下一篇:异构网络中基于遗传理论的资源分配算法