摘要 | 第4-6页 |
Abstract | 第6-8页 |
第1章 绪论 | 第17-39页 |
1.1 课题研究背景和意义 | 第17-18页 |
1.2 国内外研究历史回顾 | 第18-19页 |
1.3 国内外研究现状概述 | 第19-30页 |
1.3.1 离散和维度情感描述模型 | 第20-22页 |
1.3.2 具有代表性的情感语音数据库 | 第22-24页 |
1.3.3 语音情感特征研究现状 | 第24-27页 |
1.3.4 语音情感识别方法研究现状 | 第27-30页 |
1.4 当前语音情感识别所面临的问题与挑战 | 第30-35页 |
1.4.1 离散语音情感识别面临的问题与挑战 | 第30-32页 |
1.4.2 从离散到维度的进化 | 第32-33页 |
1.4.3 维度语音情感识别亟待解决的问题和面临的挑战 | 第33-35页 |
1.5 本文工作的主要思路与特色 | 第35-36页 |
1.6 本文的主要研究内容与结构安排 | 第36-39页 |
第2章 基于长短时特征融合的离散语音情感识别方法研究 | 第39-69页 |
2.1 引言 | 第39-40页 |
2.2 Dis-EC离散情感语料库的建立 | 第40-44页 |
2.2.1 对高质量情感语料库的要求 | 第41页 |
2.2.2 Dis-EC语料库的建立方法 | 第41-42页 |
2.2.3 Dis-EC语料库测评结果 | 第42页 |
2.2.4 与国内外其它离散情感语料库的比较 | 第42-44页 |
2.3 语音情感特征的提取与分析 | 第44-50页 |
2.3.1 基于短时分析处理的语音情感特征提取 | 第44页 |
2.3.2 情感语音的韵律学特征提取与分析 | 第44-46页 |
2.3.3 情感语音的音质特征提取与分析 | 第46-48页 |
2.3.4 小结 | 第48-50页 |
2.4 基于Elman神经网络的语音情感特征提取时长研究 | 第50-57页 |
2.4.1 语音信号的短时语段划分 | 第50-51页 |
2.4.2 Elman神经网络模型及学习算法 | 第51-54页 |
2.4.3 基于Elman神经网络的语音情感识别工作机制 | 第54-56页 |
2.4.4 语音情感特征最优识别段长的确定 | 第56-57页 |
2.5 基于GCElman网络的长短时特征融合方法 | 第57-61页 |
2.5.1 基于全局控制与短时反馈机制的GCElman网络模型 | 第57-59页 |
2.5.2 GCElman网络的学习算法 | 第59-61页 |
2.6 基于EPElman网络的长短时特征融合方法 | 第61-63页 |
2.6.1 语音情感的韵律粒度分析 | 第61-62页 |
2.6.2 基于情感韵律差异建模的EPElman网络模型 | 第62-63页 |
2.7 基于长短时特征融合的语音情感识别方法有效性验证 | 第63-68页 |
2.7.1 实验目的与配置 | 第63页 |
2.7.2 与当前主流语音情感识别方法的性能比较 | 第63-66页 |
2.7.3 与其它特征融合语音情感识别方法的性能比较 | 第66-68页 |
2.8 小结 | 第68-69页 |
第3章 汉语维度情感语料库的建立与测评 | 第69-80页 |
3.1 引言 | 第69页 |
3.2 MREC维度情感数据库的建立方法 | 第69-72页 |
3.2.1 环境、设备、软件和相关参数 | 第69-70页 |
3.2.2 情感语料挑选 | 第70-71页 |
3.2.3 录音实验分析 | 第71-72页 |
3.3 维度情感的标注方法 | 第72-74页 |
3.3.1 标注策略 | 第72-73页 |
3.3.2 标注实验分析和改进 | 第73-74页 |
3.4 MREC数据库测评结果 | 第74-77页 |
3.5 与国内外其它维度情感语料库的比较 | 第77-78页 |
3.6 小结 | 第78-80页 |
第4章 基于回归预测主动学习方法的维度语音情感识别研究 | 第80-98页 |
4.1 引言 | 第80-81页 |
4.2 被动学习、主动学习和回归预测主动学习 | 第81-83页 |
4.3 基于委员会投票的回归预测主动学习方法 | 第83-85页 |
4.3.1 基于委员预测方差的信息度衡量方法 | 第83页 |
4.3.2 不同问题场景下的算法描述 | 第83-85页 |
4.4 基于最近边界置信度的回归预测主动学习方法 | 第85-88页 |
4.4.1 基于最近边界置信度的信息度衡量方法 | 第85-87页 |
4.4.2 不同问题场景下的算法描述 | 第87-88页 |
4.5 基于差异性加权置信度的回归预测主动学习方法 | 第88-89页 |
4.5.1 样本分布差异性加权的信息度衡量方法 | 第88-89页 |
4.5.2 不同问题场景下的算法描述 | 第89页 |
4.6 主动学习方法的性能有效性验证 | 第89-96页 |
4.6.1 数据准备和情感声学特征提取 | 第89-90页 |
4.6.2 实验目的与配置 | 第90-92页 |
4.6.3 实验结果与讨论 | 第92-96页 |
4.7 小结 | 第96-98页 |
第5章 考虑情感强弱顺序的维度语音情感识别方法研究 | 第98-121页 |
5.1 引言 | 第98-99页 |
5.2 正确预测情感强弱顺序的重要性 | 第99页 |
5.3 维度语音情感识别任务的形式化描述 | 第99-100页 |
5.4 基于Kullback-Leibler测度的情感预测损失估计方法 | 第100-107页 |
5.4.1 基于均方误差的情感数值损失估计 | 第100-101页 |
5.4.2 情感强弱顺序一致性的数学定义 | 第101-102页 |
5.4.3 基于Top-one概率模型的情感强弱顺序度量 | 第102-106页 |
5.4.4 基于Kullback-Leibler测度的情感顺序损失估计 | 第106-107页 |
5.5 基于顺序敏感神经网络的维度语音情感识别方法 | 第107-111页 |
5.5.1 顺序敏感神经网络模型 | 第107-108页 |
5.5.2 顺序敏感神经网络学习算法 | 第108-111页 |
5.6 实验验证 | 第111-118页 |
5.6.1 实验目的与配置 | 第111-112页 |
5.6.2 实验性能评价标准 | 第112-113页 |
5.6.3 实验结果与讨论 | 第113-118页 |
5.7 小结 | 第118-121页 |
第6章 基于分裂矢量量化的语音情感识别分布式建模方法研究 | 第121-136页 |
6.1 引言 | 第121-122页 |
6.2 基于C-S协作结构的分布式语音情感识别模型 | 第122-123页 |
6.3 语音情感特征的提取 | 第123-124页 |
6.4 基于分裂矢量量化算法的特征压缩与解压缩方法 | 第124-126页 |
6.5 分布式离散语音情感识别实验与分析 | 第126-131页 |
6.5.1 实验目的与配置 | 第126-128页 |
6.5.2 实验结果与讨论 | 第128-131页 |
6.6 分布式维度语音情感识别实验与分析 | 第131-134页 |
6.6.1 实验目的与配置 | 第131页 |
6.6.2 实验结果与讨论 | 第131-134页 |
6.7 小结 | 第134-136页 |
结论 | 第136-139页 |
参考文献 | 第139-151页 |
攻读博士学位期间发表的论文及其他成果 | 第151-154页 |
致谢 | 第154-156页 |
个人简历 | 第156页 |