摘要 | 第5-6页 |
abstract | 第6-7页 |
第一章 绪论 | 第11-18页 |
1.1 课题研究背景及意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-16页 |
1.2.1 语音情绪感知研究现状 | 第12-14页 |
1.2.2 深度学习现状 | 第14-16页 |
1.3 本文主要工作 | 第16-17页 |
1.4 论文的组织结构 | 第17-18页 |
第二章 语音情感信号的预处理与特征抽取 | 第18-31页 |
2.1 情感及情感数据库 | 第18-19页 |
2.1.1 情感定义 | 第18页 |
2.1.2 情感数据库 | 第18-19页 |
2.2 语音情感的预处理 | 第19-23页 |
2.2.1 端点检测 | 第20-21页 |
2.2.2 预加重 | 第21-22页 |
2.2.3 分帧和加窗 | 第22-23页 |
2.3 语音情感的特征提取 | 第23页 |
2.4 支持向量机与Softmax | 第23-25页 |
2.4.1 支持向量机 | 第24页 |
2.4.2 Softmax分类 | 第24-25页 |
2.5 深度学习神经网络理论基础 | 第25-30页 |
2.5.1 人工神经网络 | 第25-27页 |
2.5.2 卷积神经网络 | 第27-29页 |
2.5.3 循环神经网络 | 第29-30页 |
2.6 本章小结 | 第30-31页 |
第三章 基于传统识别模型的语音情绪感知系统 | 第31-45页 |
3.1 系统原型的总体设计 | 第31-33页 |
3.2 语音情感数据收集与格式化 | 第33-36页 |
3.3 数据预处理与特征提取 | 第36-40页 |
3.3.1 MFCC倒谱系数的生成 | 第36-38页 |
3.3.2 语谱图的生成 | 第38-40页 |
3.4 基于MFCC + SVM的传统识别模型 | 第40-41页 |
3.5 基于传统识别模型的若干实验 | 第41-43页 |
3.5.1 基于传统模型MFCC的生成优化 | 第41-42页 |
3.5.2 基于传统模型的语谱图优化及与MFCC的特征对比实验 | 第42页 |
3.5.3 基于传统模型的的支持向量机和Softmax的分类器对比实验 | 第42-43页 |
3.6 本章小结 | 第43-45页 |
第四章 基于XNN-SVM的语音情绪感知模型 | 第45-66页 |
4.1 基于XNN-SVM语音情绪感知模型的提出 | 第45-50页 |
4.1.1 基于CNN-SVM的情绪感知模型 | 第46-48页 |
4.1.2 基于RNN-SVM的情绪感知模型 | 第48-49页 |
4.1.3 基于CRNN-SVM的情绪感知模型 | 第49-50页 |
4.2 基于XNN-SVM的语音情绪感知系统若干对比实验 | 第50-61页 |
4.2.1 CNN-SVM模型构建及若干对比实验 | 第50-54页 |
4.2.2 RNN-SVM模型构建及若干对比实验 | 第54-58页 |
4.2.3 CRNN-SVM模型构建及若干对比实验 | 第58-61页 |
4.3 基于XNN-SVM子模型在不同语料库的综合对比实验 | 第61-65页 |
4.3.1 CNN-Net与CNN-SVM在不同数据库上的对比实验 | 第61-63页 |
4.3.2 RNN-Net与RNN-SVM在不同数据库上的对比实验 | 第63-64页 |
4.3.3 CRNN-Net与CRNN-SVM在不同数据库上的对比实验 | 第64-65页 |
4.4 情绪感知模型有效性对比 | 第65页 |
4.5 本章小结 | 第65-66页 |
第五章 基于XNN-SVM的语音情绪感知系统的设计与实现 | 第66-81页 |
5.1 需求分析 | 第66-69页 |
5.1.1 客户端 | 第67-68页 |
5.1.2 服务器 | 第68-69页 |
5.2 总体设计 | 第69-70页 |
5.3 关键模块的详细设计 | 第70-74页 |
5.3.1 客户端关键模块详细设计 | 第70-73页 |
5.3.2 服务器关键模块详细设计 | 第73-74页 |
5.4 情绪感知系统在移动端的实现 | 第74-79页 |
5.4.1 语音录音模块 | 第74-75页 |
5.4.2 语音播放模块 | 第75-77页 |
5.4.3 语谱图生成模块 | 第77-78页 |
5.4.4 模型识别模块 | 第78-79页 |
5.5 系统测试与分析 | 第79页 |
5.6 本章小结 | 第79-81页 |
第六章 总结 | 第81-83页 |
6.1 本文的主要贡献 | 第81-82页 |
6.2 未来工作展望 | 第82-83页 |
致谢 | 第83-84页 |
参考文献 | 第84-86页 |