摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第1章 绪论 | 第10-24页 |
1.1 引言 | 第10-12页 |
1.2 语音情感识别国内外研究现状 | 第12-15页 |
1.3 语音情感识别基本理论 | 第15-21页 |
1.3.1 情感描述理论 | 第15-17页 |
1.3.2 语音情感语料库 | 第17-19页 |
1.3.3 语音情感特征 | 第19-21页 |
1.3.4 语音情感分类器 | 第21页 |
1.4 目前存在的问题 | 第21-22页 |
1.5 本文主要工作内容及章节安排 | 第22-24页 |
第2章 面向语音情感识别LSTM-CTC时序深度学习模型 | 第24-37页 |
2.1 引言 | 第24页 |
2.2 长短时记忆神经网络 | 第24-26页 |
2.3 LSTM-CTC时序深度学习模型 | 第26-31页 |
2.3.1 传统LSTM网络对情感语音标签学习方法 | 第26-27页 |
2.3.2 CTC方法 | 第27-31页 |
2.4 实验设计与分析 | 第31-36页 |
2.4.1 数据库与特征 | 第31-33页 |
2.4.2 实验结果与分析 | 第33-36页 |
2.5 本章小结 | 第36-37页 |
第3章 基于Attention机制语音情感识别方法研究 | 第37-49页 |
3.1 引言 | 第37-38页 |
3.2 基于AttRNN-RNN时序模型的语音情感识别方法 | 第38-45页 |
3.2.1 AttRNN-RNN情感识别模型 | 第39-44页 |
3.2.2 实验结果与分析 | 第44-45页 |
3.3 基于Attention-CTC融合模型的语音情感识别方法 | 第45-47页 |
3.3.1 Attention-CTC融合模型 | 第45-46页 |
3.3.2 实验结果与分析 | 第46-47页 |
3.4 本章小结 | 第47-49页 |
第4章 在线语音情感识别系统开发 | 第49-58页 |
4.1 系统设计要求 | 第49页 |
4.2 软件系统设计 | 第49-52页 |
4.2.1 系统框架设计 | 第49-51页 |
4.2.2 系统运行流程设计 | 第51-52页 |
4.3 模型训练与优化 | 第52-56页 |
4.3.1 语料库采集 | 第52-53页 |
4.3.2 模型训练与挑选 | 第53页 |
4.3.3 模型优化方法 | 第53-56页 |
4.4 系统性能测试 | 第56-57页 |
4.4.1 语音情感识别性能 | 第56页 |
4.4.2 系统稳健性测试 | 第56-57页 |
4.5 本章小结 | 第57-58页 |
结论 | 第58-60页 |
参考文献 | 第60-66页 |
附录A SRCB情感语料库录音文本内容 | 第66-67页 |
攻读硕士学位期间发表的论文及其他成果 | 第67-69页 |
致谢 | 第69页 |