首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

情感说话人识别及其解决方法的研究

摘要第1-5页
Abstract第5-14页
第1章 绪论第14-26页
   ·引言第14-15页
   ·说话人识别简介第15-17页
   ·情感说话人识别简介第17-18页
   ·情感说话人识别研究面临的困难第18-20页
   ·情感说话人识别的主要研究成果第20-23页
   ·本文的主要研究工作第23-26页
第2章 说话人识别系统第26-40页
   ·概述第26-28页
   ·梅尔倒谱系数第28-31页
   ·高斯混合模型第31-35页
     ·高斯混合模型定义第31-32页
     ·高斯混合模型的参数估计第32-33页
     ·基于GMM-UBM的说话人识别第33-35页
   ·支持向量机第35-37页
     ·基本原理第35-36页
     ·线性可分情况第36页
     ·线性不可分情况第36-37页
   ·说话人识别的性能评价标准第37-38页
     ·错误接受率和错误拒绝率第38页
     ·等错误率和DET曲线第38页
   ·本章小结第38-40页
第3章 情感因素对说话人识别的影响第40-69页
   ·情感语音数据库介绍第40-46页
     ·情感的定义第40-43页
     ·情感语音数据库第43-45页
     ·MASC@CCNT情感语音数据库第45-46页
   ·情感因素对说话人特征及其分布的影响第46-52页
     ·情感因素对基音频率的影响第46-48页
     ·情感因素对功率谱的影响第48-51页
     ·情感因素对系统性能的影响第51-52页
   ·情感因素影响的实验分析第52-58页
     ·情感因素引起的说话人模型的变化第52-55页
     ·情感因素引起的特征差异分析第55-56页
     ·特征差异的可视化第56-58页
   ·情感因素对人耳听辨结果的影响第58-62页
     ·实验设计和流程第58-59页
     ·实验结果分析第59-62页
   ·情感因素对说话人识别系统性能的影响第62-67页
     ·声纹打卡系统实验第62-64页
     ·实验分析情感因素对识别系统性能的影响第64-67页
     ·实验总结第67页
   ·本章小结第67-69页
第4章 基于通道补偿的情感规整方法第69-86页
   ·影响说话人识别系统性能的三个因素第69-70页
   ·解决通道因素影响的主要方法第70-73页
     ·解决通道因素影响的方法分类第70-71页
     ·解决通道因素影响的方法简介第71-73页
   ·解决噪音因素影响的主要方法第73-74页
   ·冗余属性投影方法(NAP)第74-80页
     ·基于NAP方法的情感说话人识别第74-75页
     ·NAP投影矩阵的计算方法第75-76页
     ·NAP方法的性能评估第76-80页
   ·隐藏因子分析方法(LFA)第80-85页
     ·LFA方法的原理第80页
     ·基于LFA方法的情感说话人识别第80-83页
     ·LFA方法的性能评估第83-85页
   ·本章小结第85-86页
第5章 基于中性情感模型转换方法的说话人识别第86-102页
   ·中性情感模型转换方法概述第86-88页
   ·中性情感模型转换方程第88-89页
   ·中性情感语音相关性的实验分析第89-91页
   ·基于高斯分量的中性情感模型转化算法第91-94页
     ·转换算法的描述第91-93页
     ·转换方法的推导过程第93-94页
   ·基于参数的中性情感模型转换方法第94-98页
     ·中性情感转换方程的参数化理解第94-95页
     ·基于多项式方程的转换方法第95页
     ·转换方法在情感说话人识别中的应用第95-97页
     ·特征选择和转换模型学习方法第97-98页
   ·中性情感模型转换方法的性能分析第98-101页
     ·实验设置第98页
     ·实验结果比较第98-100页
     ·基于参数的转换方法在GMM-UBM系统上的实验第100-101页
   ·本章小结第101-102页
第6章 基于频谱平移方法的情感说话人识别第102-117页
   ·频谱平移方法概述第102-104页
   ·频谱平移方法的流程第104-108页
     ·频谱平移方法的原理第104-105页
     ·频谱平移方法的实现过程第105-106页
     ·合成语音和真实情感语音的相似性比较第106-108页
   ·基于频谱平移的说话人识别第108-111页
     ·基于频谱平移的特征提取方法第108-109页
     ·基于多状态模型的情感说话人识别第109-111页
   ·基于频谱平移的说话人识别系统的性能分析第111-116页
     ·实验设置第111页
     ·对比实验第111-113页
     ·平移距离和系统性能的关系第113-114页
     ·随机频谱平移实验第114-116页
   ·本章小结第116-117页
第7章 基于得分选择方法的情感说话人识别第117-130页
   ·中性情感语音混合的问题第117-118页
   ·情感比率和系统性能的关系第118-122页
     ·实验设置第118页
     ·测试语音情感比率和识别率的关系第118-120页
     ·四种测试得分的分布规律第120-122页
     ·实验结果总结第122页
   ·得分选择方法第122-125页
     ·方法详述第122-124页
     ·阈值的设定第124-125页
   ·得分选择方法的性能分析第125-128页
     ·识别性能分析实验第125-127页
     ·得分选择方法对改变情感比率的作用第127-128页
     ·不同阈值对系统性能的影响第128页
   ·本章小结第128-130页
第8章 情感说话人识别中一些问题的思考第130-150页
   ·训练和测试语音失配的问题第130-134页
     ·失配问题影响系统性能的原理第130-132页
     ·解决情感问题的前提假设第132-133页
     ·中性情感语音转换问题第133-134页
   ·发声力度对识别性能的影响第134-136页
     ·发声力度和情感因素的关系第134-135页
     ·基于频谱平移方法的发声力度实验第135-136页
   ·自适应方法在情感说话人识别中的应用问题第136-142页
     ·GMM-UBM自适应方法分析第136-138页
     ·自适应方法的性能评估第138-142页
   ·说话人识别系统的加速问题第142-149页
     ·混合模型降维算法第142-144页
     ·基于GMM聚类的UBM模型降阶算法第144-146页
     ·算法性能评估第146-149页
   ·本章小结第149-150页
第9章 总结和展望第150-154页
   ·总结第150-152页
   ·未来的研究方向第152-154页
附录1第154-157页
参考文献第157-172页
攻读博士学位期间主要的研究成果第172-175页
致谢第175页

论文共175页,点击 下载论文
上一篇:MD5快速碰撞算法之研究
下一篇:无线Ad Hoc网络中可靠路由若干关键问题的研究