情感说话人识别中的基频失配及其补偿方法研究

致谢	第1-7页
摘要	第7-9页
Abstract	第9-19页
第1章绪论	第19-35页
·引言	第19-20页
·说话人识别概述	第20-22页
·说话人内在因素变化的影响	第22-25页
·情感说话人识别及其面临的困难	第25-29页
·基频在说话人识别中的应用及其失配影响	第29-31页
·本文主要研究内容	第31-35页
第2章说话人识别系统	第35-45页
·说话人识别的系统框架	第35-36页
·语音特征	第36-39页
·美尔倒谱系数(MFCC)	第36-38页
·基音频率	第38-39页
·说话人模型	第39-42页
·高斯混合模型(GMM)	第39-40页
·GMM-UBM-MAP结构的说话人识别	第40-42页
·说话人识别的性能评价标准	第42-44页
·错误接受率和错误拒绝率	第42-43页
·等错误率(EER)和DET曲线	第43-44页
·本章小结	第44-45页
第3章情感语音的高/低差异类的划分	第45-65页
·情感数据库介绍	第45-53页
·情感语音的定义及分类	第45-49页
·情感语音数据库的现状	第49-51页
·本文的实验语音数据库	第51-53页
·情感语音划分的概述	第53页
·基于识别性能差异现象的情感语音划分	第53-55页
·基于语音特征分布的情感语音划分	第55-57页
·不同情感语音基频分布的差异	第55-57页
·不同情感语音MFCC分布的差异	第57页
·基于语音特征聚类结果的情感语音划分	第57-62页
·韵律特征的聚类结果	第58-60页
·声学特征MFCC的聚类结果	第60-62页
·基于人耳听辨结果的情感语音划分	第62-64页
·实验设置	第62-63页
·实验结果分析	第63-64页
·本章小结	第64-65页
第4章情感变化引发的基频失配	第65-83页
·情感语音的韵律特征偏差分析	第65-71页
·基频偏差分析	第66-68页
·音强偏差分析	第68-70页
·音长偏差分析	第70-71页
·情感变化引发的基频失配及其影响	第71-74页
·情感影响下基频失配产生的原理	第72-73页
·情感影响下基频失配与说话人识别性能之间的关系	第73-74页
·基频与MFCC的关联	第74-80页
·声道与声源的互扰	第74-76页
·基频和MFCC之间关联的概述	第76页
·基频与MFCC相关性的实验分析	第76-78页
·降低基频失配对增加语音说话人之间的可区分性的作用	第78-80页
·情感说话人识别中模式失配问题的解决思路	第80-82页
·本章小结	第82-83页
第5章基于基频失配检测的情感屏蔽方法	第83-99页
·算法思路	第83-84页
·情感语音的差异检测	第84-86页
·基于短时声学特征的差异检测	第84-85页
·性别识别	第85页
·基于全局韵律特征的差异检测	第85-86页
·融合方法	第86页
·基于基频的高失配检测	第86-88页
·语音的分割	第86-87页
·高失配检测	第87-88页
·屏蔽的策略	第88-90页
·基于情感屏蔽的说话人识别系统	第90页
·实验结果及分析	第90-98页
·性别识别的影响	第91页
·差异检测的效果	第91-93页
·高失配部分的成分分析	第93-94页
·高失配部分与中性语音在MFCC上分布的差异	第94-95页
·MASC库上的实验结果	第95-96页
·EPST库上的实验结果	第96-98页
·本章小结	第98-99页
第6章基于基频映射的情感拓展方法	第99-119页
·算法思路	第99-102页
·基于基频映射的虚拟高差异情感语音构建	第102-105页
·基频均值的转换关系	第102-103页
·多项式函数系数的确定	第103-104页
·高差异类情感语音基频序列的构建	第104-105页
·虚拟高差异类情感语音的合成	第105页
·基于双模型得分可靠性加权的情感说话人识别	第105-107页
·高失配部分的检测(G-HMD)	第106页
·基于双模型得分可靠性加权的情感说话人识别	第106-107页
·基于识别率的权重确定策略	第107-109页
·合理性分析	第107-108页
·基于识别率的权重策略	第108-109页
·实验分析及讨论	第109-117页
·实验设置	第109页
·基频映射函数的最优阶数	第109-110页
·MASC库上的实验结果	第110-111页
·双模型方法中得分计算方式的讨论	第111-112页
·拟合的和真实的改变幅度下方法性能的差异	第112-113页
·EPST库上的实验效果	第113-114页
·基于识别率的权重确定策略的有效性讨论	第114-115页
·基频映射的可视化效果	第115-116页
·不同情感拓展方法的比较	第116-117页
·本章小结	第117-119页
第7章基于基频修正的情感规整方法	第119-132页
·算法思路	第119-121页
·高差异类情感语音基频序列的修正	第121-122页
·基于PSOLA的基频修改	第122-123页
·基频修正函数及其效果	第123-127页
·基频修正函数的参数数目确定	第123-124页
·基频修正函数的效果	第124-126页
·基频修正的可视化效果	第126-127页
·实验结果及分析	第127-131页
·MASC库上的实验结果	第127-129页
·AIC准则有效性的讨论	第129页
·采用拟合的与真实的基频均值规整时系统性能的比较	第129-130页
·EPST库上的实验结果	第130-131页
·本章小结	第131-132页
第8章基于基频失配评估的得分补偿方法	第132-143页
·算法思想	第132-133页
·得分规整分析	第133-137页
·得分计算	第133-134页
·得分加权的作用域选择	第134-136页
·基频失配与模式失配	第136-137页
·基于基频失配评估的得分补偿方法	第137-140页
·高失配检测	第138-139页
·基频失配相关的得分可靠性加权函数	第139-140页
·基于基频失配评估的得分补偿的说话人识别系统	第140页
·实验结果及分析	第140-142页
·MASC库上的实验结果	第140-141页
·EPST库上的实验结果	第141-142页
·本章小结	第142-143页
第9章分析与讨论	第143-158页
·不同情感补偿方法的融合	第143-145页
·MASC库上的融合效果	第143-144页
·EPST库上的融合效果	第144-145页
·差异检测中入耳与机器的比较	第145-147页
·人耳听辨与机器分类下差异检测的性能比较	第145-146页
·在两种差异检测下说话人识别的对比实验	第146-147页
·说话人确认的性能讨论	第147-154页
·本文方法在说话人确认下的效果	第147-149页
·得分规整在情感说话人识别中的效果	第149-152页
·UBM训练语料的不同对情感说话人识别系统性能的影响	第152-154页
·发声力度问题的研究	第154-157页
·发声力度对说话人识别的影响	第154-155页
·发声力度实验的数据库及实验设置	第155-156页
·发声力度变化下基频均值的变化	第156页
·基于基频映射的多发声力度模型系统及其实验结果	第156-157页
·本章小结	第157-158页
第10章总结与展望	第158-162页
·总结	第158-160页
·工作展望	第160-162页
参考文献	第162-180页
攻读博士学位期间主要的研究成果	第180-183页
作者简介	第183页