基于语音和图像的多模态情感识别研究

摘要	第4-5页
Abstract	第5-6页
第1章绪论	第9-19页
1.1 课题背景及研究目的和意义	第9-10页
1.2 人脸图像情感识别国内外研究现状	第10-13页
1.3 语音情感识别国内外研究现状	第13-14页
1.4 多模态融合情感识别国内外研究现状	第14-16页
1.5 国内外文献综述的简析	第16-18页
1.6 本文主要研究内容	第18-19页
第2章情感识别理论模型及原理	第19-27页
2.1 SAVEE情感数据库介绍	第19页
2.2 系统框架	第19-20页
2.3 模态信息融合策略	第20-22页
2.3.1 特征层融合	第21-22页
2.3.2 决策层融合	第22页
2.4 基于SVM的分类原理	第22-26页
2.4.1 SVM两分类原理	第22-24页
2.4.2 SVM多分类原理	第24-25页
2.4.3 SVM参数寻优	第25-26页
2.5 本章小结	第26-27页
第3章语音情感特征提取	第27-43页
3.1 语音情感特征简述	第27-28页
3.2 语音信号的时域分析	第28-32页
3.2.1 短时能量	第28-31页
3.2.2 语音持续时间	第31-32页
3.3 语音信号的倒谱域分析求基音频率	第32-35页
3.4 LPC法提取语音材料的共振峰参数	第35-38页
3.5 语音信号的MFCC参数提取	第38-41页
3.6 语音情感识别	第41-42页
3.7 本章小结	第42-43页
第4章图像情感特征提取	第43-51页
4.1 提取单帧峰值图像的LBP特征	第43-47页
4.1.1 LBP算子	第43-45页
4.1.2 人脸图像预处理	第45-47页
4.2 图像序列的特征点的特征提取	第47-48页
4.3 人脸图像情感识别	第48-50页
4.3.1 基于单帧峰值图像的情感识别	第48-49页
4.3.2 基于图像序列的情感识别	第49-50页
4.4 本章小结	第50-51页
第5章语音情感特征与图像情感特征融合	第51-68页
5.1 特征层融合	第51-55页
5.1.1 直接融合	第51-52页
5.1.2 使用无监督的主成分分析法进行特征融合	第52-54页
5.1.3 使用有监督的LDA法进行特征融合	第54-55页
5.2 决策层融合	第55-64页
5.2.1 乘积规则	第57-58页
5.2.2 均值规则	第58-60页
5.2.3 求和规则	第60-61页
5.2.4 最大值规则	第61-63页
5.2.5 最小值规则	第63-64页
5.3 单模态情感识别与多模态情感识别结果对比	第64-65页
5.4 融合方法效果对比	第65-66页
5.5 七种情感识别率对比分析	第66页
5.6 本章小结	第66-68页
结论	第68-70页
参考文献	第70-77页
附录 1	第77-81页
攻读硕士学位期间发表的学术论文	第81-83页
致谢	第83页