首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

语音情感识别关键技术研究

摘要第4-6页
Abstract第6-8页
第1章 绪论第17-39页
    1.1 课题研究背景和意义第17-18页
    1.2 国内外研究历史回顾第18-19页
    1.3 国内外研究现状概述第19-30页
        1.3.1 离散和维度情感描述模型第20-22页
        1.3.2 具有代表性的情感语音数据库第22-24页
        1.3.3 语音情感特征研究现状第24-27页
        1.3.4 语音情感识别方法研究现状第27-30页
    1.4 当前语音情感识别所面临的问题与挑战第30-35页
        1.4.1 离散语音情感识别面临的问题与挑战第30-32页
        1.4.2 从离散到维度的进化第32-33页
        1.4.3 维度语音情感识别亟待解决的问题和面临的挑战第33-35页
    1.5 本文工作的主要思路与特色第35-36页
    1.6 本文的主要研究内容与结构安排第36-39页
第2章 基于长短时特征融合的离散语音情感识别方法研究第39-69页
    2.1 引言第39-40页
    2.2 Dis-EC离散情感语料库的建立第40-44页
        2.2.1 对高质量情感语料库的要求第41页
        2.2.2 Dis-EC语料库的建立方法第41-42页
        2.2.3 Dis-EC语料库测评结果第42页
        2.2.4 与国内外其它离散情感语料库的比较第42-44页
    2.3 语音情感特征的提取与分析第44-50页
        2.3.1 基于短时分析处理的语音情感特征提取第44页
        2.3.2 情感语音的韵律学特征提取与分析第44-46页
        2.3.3 情感语音的音质特征提取与分析第46-48页
        2.3.4 小结第48-50页
    2.4 基于Elman神经网络的语音情感特征提取时长研究第50-57页
        2.4.1 语音信号的短时语段划分第50-51页
        2.4.2 Elman神经网络模型及学习算法第51-54页
        2.4.3 基于Elman神经网络的语音情感识别工作机制第54-56页
        2.4.4 语音情感特征最优识别段长的确定第56-57页
    2.5 基于GCElman网络的长短时特征融合方法第57-61页
        2.5.1 基于全局控制与短时反馈机制的GCElman网络模型第57-59页
        2.5.2 GCElman网络的学习算法第59-61页
    2.6 基于EPElman网络的长短时特征融合方法第61-63页
        2.6.1 语音情感的韵律粒度分析第61-62页
        2.6.2 基于情感韵律差异建模的EPElman网络模型第62-63页
    2.7 基于长短时特征融合的语音情感识别方法有效性验证第63-68页
        2.7.1 实验目的与配置第63页
        2.7.2 与当前主流语音情感识别方法的性能比较第63-66页
        2.7.3 与其它特征融合语音情感识别方法的性能比较第66-68页
    2.8 小结第68-69页
第3章 汉语维度情感语料库的建立与测评第69-80页
    3.1 引言第69页
    3.2 MREC维度情感数据库的建立方法第69-72页
        3.2.1 环境、设备、软件和相关参数第69-70页
        3.2.2 情感语料挑选第70-71页
        3.2.3 录音实验分析第71-72页
    3.3 维度情感的标注方法第72-74页
        3.3.1 标注策略第72-73页
        3.3.2 标注实验分析和改进第73-74页
    3.4 MREC数据库测评结果第74-77页
    3.5 与国内外其它维度情感语料库的比较第77-78页
    3.6 小结第78-80页
第4章 基于回归预测主动学习方法的维度语音情感识别研究第80-98页
    4.1 引言第80-81页
    4.2 被动学习、主动学习和回归预测主动学习第81-83页
    4.3 基于委员会投票的回归预测主动学习方法第83-85页
        4.3.1 基于委员预测方差的信息度衡量方法第83页
        4.3.2 不同问题场景下的算法描述第83-85页
    4.4 基于最近边界置信度的回归预测主动学习方法第85-88页
        4.4.1 基于最近边界置信度的信息度衡量方法第85-87页
        4.4.2 不同问题场景下的算法描述第87-88页
    4.5 基于差异性加权置信度的回归预测主动学习方法第88-89页
        4.5.1 样本分布差异性加权的信息度衡量方法第88-89页
        4.5.2 不同问题场景下的算法描述第89页
    4.6 主动学习方法的性能有效性验证第89-96页
        4.6.1 数据准备和情感声学特征提取第89-90页
        4.6.2 实验目的与配置第90-92页
        4.6.3 实验结果与讨论第92-96页
    4.7 小结第96-98页
第5章 考虑情感强弱顺序的维度语音情感识别方法研究第98-121页
    5.1 引言第98-99页
    5.2 正确预测情感强弱顺序的重要性第99页
    5.3 维度语音情感识别任务的形式化描述第99-100页
    5.4 基于Kullback-Leibler测度的情感预测损失估计方法第100-107页
        5.4.1 基于均方误差的情感数值损失估计第100-101页
        5.4.2 情感强弱顺序一致性的数学定义第101-102页
        5.4.3 基于Top-one概率模型的情感强弱顺序度量第102-106页
        5.4.4 基于Kullback-Leibler测度的情感顺序损失估计第106-107页
    5.5 基于顺序敏感神经网络的维度语音情感识别方法第107-111页
        5.5.1 顺序敏感神经网络模型第107-108页
        5.5.2 顺序敏感神经网络学习算法第108-111页
    5.6 实验验证第111-118页
        5.6.1 实验目的与配置第111-112页
        5.6.2 实验性能评价标准第112-113页
        5.6.3 实验结果与讨论第113-118页
    5.7 小结第118-121页
第6章 基于分裂矢量量化的语音情感识别分布式建模方法研究第121-136页
    6.1 引言第121-122页
    6.2 基于C-S协作结构的分布式语音情感识别模型第122-123页
    6.3 语音情感特征的提取第123-124页
    6.4 基于分裂矢量量化算法的特征压缩与解压缩方法第124-126页
    6.5 分布式离散语音情感识别实验与分析第126-131页
        6.5.1 实验目的与配置第126-128页
        6.5.2 实验结果与讨论第128-131页
    6.6 分布式维度语音情感识别实验与分析第131-134页
        6.6.1 实验目的与配置第131页
        6.6.2 实验结果与讨论第131-134页
    6.7 小结第134-136页
结论第136-139页
参考文献第139-151页
攻读博士学位期间发表的论文及其他成果第151-154页
致谢第154-156页
个人简历第156页

论文共156页,点击 下载论文
上一篇:现代思潮与新闻文化
下一篇:湖南省县医院适宜规模研究