基于模糊认知图的语音情感识别关键问题研究
摘要 | 第3-6页 |
ABSTRACT | 第6-9页 |
第一章 绪论 | 第19-30页 |
1.1 研究背景及意义 | 第19-20页 |
1.2 国内外研究现状 | 第20-25页 |
1.2.1 语音情感识别 | 第20-22页 |
1.2.2 Hilbert-Huang变换 | 第22-23页 |
1.2.3 模糊认知图 | 第23-25页 |
1.3 主要研究内容及技术路线 | 第25-28页 |
1.4 本文的组织结构 | 第28-30页 |
第二章 语音情感识别基本理论 | 第30-45页 |
2.1 引言 | 第30页 |
2.2 情感类别的划分 | 第30-37页 |
2.2.1 离散情感划分 | 第30-31页 |
2.2.2 情感维度空间模型 | 第31-35页 |
2.2.3 基于离散情感的维度空间模型 | 第35-36页 |
2.2.4 其他情感模型 | 第36-37页 |
2.3 情感语音特征提取 | 第37-41页 |
2.3.1 韵律特征 | 第37-39页 |
2.3.2 音质特征 | 第39-40页 |
2.3.3 谱特征 | 第40-41页 |
2.4 情感语音识别模型 | 第41-44页 |
2.4.1 神经网络 | 第41-42页 |
2.4.2 支持向量机 | 第42-43页 |
2.4.3 KNN网络 | 第43-44页 |
2.5 本章小结 | 第44-45页 |
第三章 语音情感数据库 | 第45-55页 |
3.1 引言 | 第45页 |
3.2 TYUT2.0语音情感数据库的建立 | 第45-52页 |
3.2.1 语音情感数据库构建方法 | 第45-46页 |
3.2.2 截取情感语音素材 | 第46-47页 |
3.2.3 语句的有效性评价 | 第47-52页 |
3.3 柏林情感语音 | 第52-53页 |
3.4 常用情感语料库概述 | 第53-54页 |
3.5 本章小结 | 第54-55页 |
第四章 基于HHT方法的情感语音特征提取 | 第55-72页 |
4.1 引言 | 第55页 |
4.2 经验模态分解 | 第55-59页 |
4.2.1 瞬时频率 | 第55-57页 |
4.2.2 HHT的提出及固有模态函数 | 第57-58页 |
4.2.3 经验模态分解 | 第58-59页 |
4.3 集合经验模态分解方法EEMD | 第59-64页 |
4.3.1 EEMD方法原理 | 第59-61页 |
4.3.2 EEMD方法优势分析 | 第61-64页 |
4.4 Hilbert谱分析 | 第64-66页 |
4.4.1 Hilbert谱 | 第64-65页 |
4.4.2 Hilbert边际谱 | 第65-66页 |
4.5 基于EEMD情感语音特征提取 | 第66-68页 |
4.5.1 Teager能量算子 | 第67页 |
4.5.2 情感语音特征提取步骤 | 第67-68页 |
4.6 基于HHT方法的情感语音特征提取 | 第68-71页 |
4.6.1 情感语音特征提取方法介绍 | 第68-69页 |
4.6.2 特征分析 | 第69-71页 |
4.7 本章小结 | 第71-72页 |
第五章 基于模糊认知图的语音情感识别网络的研究 | 第72-92页 |
5.1 引言 | 第72-73页 |
5.2 FCM基本理论 | 第73-75页 |
5.2.1 基本理论概述 | 第73-74页 |
5.2.2 推理过程 | 第74-75页 |
5.3 构建基于FCM的情感语音识别网络 | 第75-80页 |
5.3.1 FCM情感语音识别网络的架构 | 第75-77页 |
5.3.2 所提学习算法 | 第77-80页 |
5.4 单个特征实验及结果分析 | 第80-85页 |
5.4.1 实验数据库简介 | 第80-81页 |
5.4.2 特征对比实验及分析 | 第81-85页 |
5.5 融合特征实验及结果分析 | 第85-88页 |
5.5.1 特征选择 | 第85-86页 |
5.5.2 融合特征实验结果分析 | 第86-88页 |
5.6 识别网络对比实验 | 第88-91页 |
5.6.1 特征选择 | 第88-89页 |
5.6.2 识别网络实验结果及分析 | 第89-91页 |
5.7 本章小结 | 第91-92页 |
第六章 融合算法应用于语音情感识别的研究 | 第92-104页 |
6.1 引言 | 第92页 |
6.2 数据融合 | 第92-95页 |
6.2.1 数据融合概念 | 第92-93页 |
6.2.2 特征级融合 | 第93-94页 |
6.2.3 决策级融合 | 第94-95页 |
6.3 决策融合E-FCM算法介绍 | 第95-98页 |
6.3.1 概率矩阵 | 第95-96页 |
6.3.2 决策方法制定 | 第96-98页 |
6.4 实验结果与分析 | 第98-103页 |
6.4.1 语音特征的选择 | 第98-99页 |
6.4.2 决策融合e-FCM实验 | 第99-103页 |
6.5 本章小结 | 第103-104页 |
第七章 连续维度语音情感识别研究 | 第104-115页 |
7.1 引言 | 第104-105页 |
7.2 情感语音特征与PAD三维相关性分析 | 第105-107页 |
7.2.1 原理介绍 | 第105-106页 |
7.2.2 Pearson相关介绍 | 第106页 |
7.2.3 结果分析 | 第106-107页 |
7.3 犹豫模糊集决策融合预测PAD值 | 第107-111页 |
7.3.1 犹豫模糊信息 | 第107-109页 |
7.3.2 加权融合预测PAD值 | 第109-111页 |
7.4 仿真实验及结果分析 | 第111-114页 |
7.4.1 PAD数据的概率特性验证 | 第111-112页 |
7.4.2 情感PAD数据空间分布 | 第112-114页 |
7.5 结论 | 第114-115页 |
第八章 总结和展望 | 第115-118页 |
8.1 本文总结 | 第115-116页 |
8.2 展望 | 第116-118页 |
参考文献 | 第118-132页 |
致谢 | 第132-133页 |
攻读博士学位期间发表的学术论文及科研工作情况 | 第133-134页 |