摘要 | 第5-6页 |
abstract | 第6-7页 |
第一章 绪论 | 第11-16页 |
1.1 课题研究背景及意义 | 第11页 |
1.2 国内外相关研究 | 第11-13页 |
1.2.1 语音情感挖掘的研究历史 | 第11-12页 |
1.2.2 语音情感挖掘的研究现状 | 第12-13页 |
1.3 本文研究内容及创新点 | 第13-14页 |
1.4 本文的结构安排 | 第14-16页 |
第二章 语音情感挖掘技术基础 | 第16-23页 |
2.1 语音信号特征类型 | 第16-18页 |
2.1.1 语音韵律特征 | 第16-17页 |
2.1.2 语音音质特征 | 第17-18页 |
2.1.3 基于谱的特征 | 第18页 |
2.2 语音情感表示研究 | 第18-19页 |
2.2.1 离散情感表示 | 第19页 |
2.2.2 基于维度的情感表示 | 第19页 |
2.3 经典语音情感计算模型 | 第19-22页 |
2.3.1 HMM | 第20-21页 |
2.3.2 GMM | 第21页 |
2.3.3 SVM | 第21-22页 |
2.4 本章小结 | 第22-23页 |
第三章 基于多通道特征的卷积循环网络语音情感挖掘模型 | 第23-49页 |
3.1 引言 | 第23页 |
3.2 关于MSCGNN使用的主要深度学习理论介绍 | 第23-28页 |
3.2.1 深度学习的反向传播学习算法 | 第23-25页 |
3.2.2 卷积神经网络基础结构 | 第25-27页 |
3.2.3 循环神经网络基础结构 | 第27-28页 |
3.3 MSCGNN神经网络结构总体设计 | 第28-39页 |
3.3.1 MSCGNN输入层数据特征结构 | 第29-34页 |
3.3.2 MSCGNN卷积网络过程机制 | 第34-37页 |
3.3.3 MSCGNN循环网络过程机制 | 第37页 |
3.3.4 MSCGNN最终分类层设计 | 第37-39页 |
3.4 实验结果与分析 | 第39-47页 |
3.4.1 实验环境介绍 | 第39-40页 |
3.4.2 对比实验结果展示 | 第40-47页 |
3.5 本章小结 | 第47-49页 |
第四章 基于变分自编码器的混淆再标注数据增强策略 | 第49-64页 |
4.1 引言 | 第49页 |
4.2 数据增强策略及自编器相关介绍 | 第49-54页 |
4.2.1 数据增强的目的和意义 | 第49-50页 |
4.2.2 主流的数据增强领域技术 | 第50-51页 |
4.2.3 自编码器相关技术 | 第51-52页 |
4.2.4 变分自编码器原理介绍 | 第52-54页 |
4.3 现有语音数据增强策略及其缺陷 | 第54-55页 |
4.4 基于变分自编码器的混淆再标注数据增强策略 | 第55-59页 |
4.4.1 策略设计动机 | 第55页 |
4.4.2 策略详细设计 | 第55-59页 |
4.5 实验结果与分析 | 第59-63页 |
4.5.1 训练过程对比与分析 | 第60-61页 |
4.5.2 针对测试集相关指标对比与分析 | 第61-63页 |
4.6 本章小结 | 第63-64页 |
第五章 基于在线学习的中文语音情感挖掘系统设计 | 第64-81页 |
5.1 离线学习的缺陷与不足 | 第64-65页 |
5.2 在线学习机制的相关介绍与应用意义 | 第65-68页 |
5.2.1 在线学习基础理论 | 第65-66页 |
5.2.2 语音情感挖掘问题引入在线学习的意义 | 第66-67页 |
5.2.3 基于中文语音情感挖掘问题的在线学习模式 | 第67-68页 |
5.3 在线学习系统的总体设计 | 第68-75页 |
5.3.1 系统结构分层设计 | 第69-70页 |
5.3.2 系统详细设计 | 第70-75页 |
5.4 原型系统相关功能展示 | 第75-80页 |
5.4.1 任务处理过程展示 | 第75-76页 |
5.4.2 特征构建过程展示 | 第76-77页 |
5.4.3 模型调用及情感计算过程展示 | 第77页 |
5.4.4 系统在线学习机制展示 | 第77-78页 |
5.4.5 客户端界面展示 | 第78-80页 |
5.5 本章小结 | 第80-81页 |
第六章 总结与展望 | 第81-83页 |
6.1 工作总结 | 第81-82页 |
6.2 工作展望 | 第82-83页 |
致谢 | 第83-84页 |
参考文献 | 第84-89页 |