摘要 | 第1-5页 |
ABSTRACT | 第5-13页 |
第1章 绪论 | 第13-18页 |
·引言 | 第13页 |
·语音情感识别的应用及研究意义 | 第13-15页 |
·语音情感识别的难点 | 第15-16页 |
·本文的主要目标和工作 | 第16-18页 |
第2章 语音情感识别的技术回顾 | 第18-40页 |
·情感语料的采集 | 第18-27页 |
·范围 | 第18-24页 |
·自然度 | 第24-26页 |
·标注及其他信息 | 第26-27页 |
·提取的声学特征及选用的统计模型 | 第27-31页 |
·声学特征 | 第27-29页 |
·统计模型 | 第29-31页 |
·特征参数的降维 | 第31-33页 |
·线性特征抽取算法 | 第31-32页 |
·非线性特征抽取算法 | 第32页 |
·特征选择算法 | 第32-33页 |
·结合其他信息的情感识别 | 第33-38页 |
·人脸表情辅助的情感识别 | 第34-36页 |
·语义信息辅助的情感识别 | 第36-37页 |
·生理信号辅助的情感识别 | 第37-38页 |
·结合其他信息 | 第38页 |
·本章小结 | 第38-40页 |
第3章 情感语料库的采集和标注 | 第40-53页 |
·情感语料的采集 | 第40-42页 |
·表演语料和引导语料 | 第40-42页 |
·自然语料 | 第42页 |
·情感语料的标注 | 第42-45页 |
·标注过程的设计 | 第43页 |
·标注的结果及分析 | 第43-45页 |
·情感语料库的可视化分析 | 第45-52页 |
·语料库可视化分析的意义 | 第45-46页 |
·Sammon's非线性映射算法及其可行性 | 第46-49页 |
·二维空间可视化图MASE MAP的生成与分析 | 第49-52页 |
·本章小结 | 第52-53页 |
第4章 声学特征的提取与处理 | 第53-71页 |
·语音产生的生理过程及经典模型 | 第53-56页 |
·常用的语音声学特征 | 第56-62页 |
·语音信号数字化及预处理 | 第57-58页 |
·时域特征 | 第58-60页 |
·倒谱特征 | 第60-62页 |
·感知线性预测参数 | 第62页 |
·结合时域和倒谱特征的语音情感识别 | 第62-67页 |
·实验结果与分析 | 第67-70页 |
·情感语音语料库 | 第67-68页 |
·结果分析 | 第68-70页 |
·本章小结 | 第70-71页 |
第5章 特征向量的线性及非线性降维算法 | 第71-101页 |
·结合PCA和LDA的分层次语音情感识别 | 第71-79页 |
·线性特征降维算法PCA和LDA | 第71-74页 |
·基于PCA和LDA的语音情感识别 | 第74-76页 |
·结合PCA和LDA的分层次语音情感识别 | 第76-77页 |
·实验结果与分析 | 第77-79页 |
·基于ELE算法的语音情感识别 | 第79-87页 |
·非线性特征降维算法Isomap和LLE | 第79-80页 |
·基于流形学习的非线性特征降维算法ELE | 第80-83页 |
·基于ELE的语音情感识别及实验 | 第83-87页 |
·基于特征选择的语音情感识别 | 第87-100页 |
·基于PCA-L1-Rank和LDA-L1-Rank的语音情感识别及实验 | 第88-93页 |
·基于类集和类对特征选择算法的语音情感识别及实验 | 第93-100页 |
·本章小结 | 第100-101页 |
第6章 结合其他信息的情感识别 | 第101-123页 |
·结合对话信息的语音情感识别 | 第101-106页 |
·对话环境中情感语音语料的获取及分析 | 第102-103页 |
·结合对话情感关联的语音情感识别 | 第103-105页 |
·实验结果与分析 | 第105-106页 |
·结合人脸表情信息的双模情感识别 | 第106-118页 |
·双模情感识别系统框架 | 第107-108页 |
·人脸表情特征的提取 | 第108-112页 |
·基于THMM的情感识别 | 第112-116页 |
·实验结果与分析 | 第116-118页 |
·噪音干扰的语音情感识别 | 第118-122页 |
·不同信噪比的情感语音语料的获取 | 第118-119页 |
·基于ELE算法的带噪语音情感识别 | 第119-120页 |
·实验结果与分析 | 第120-122页 |
·本章小结 | 第122-123页 |
第7章 SERS语音情感识别系统 | 第123-129页 |
·系统包含的模块及主要功能 | 第123-126页 |
·语音情感识别过程演示 | 第126-128页 |
·本章小结 | 第128-129页 |
第8章 总结和展望 | 第129-131页 |
·工作总结 | 第129页 |
·展望 | 第129-131页 |
附录一 表演语料和引导语料中采用的部分录音脚本 | 第131-140页 |
附录二 部分听辨人的基本信息 | 第140-142页 |
附录三 SAMMON'S算法新坐标计算中偏导数的推导过程 | 第142-145页 |
参考文献 | 第145-158页 |
攻读博士学位期间主要的研究成果 | 第158-160页 |
致谢 | 第160-161页 |