首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

情感说话人识别中的基频失配及其补偿方法研究

致谢第1-7页
摘要第7-9页
Abstract第9-19页
第1章 绪论第19-35页
   ·引言第19-20页
   ·说话人识别概述第20-22页
   ·说话人内在因素变化的影响第22-25页
   ·情感说话人识别及其面临的困难第25-29页
   ·基频在说话人识别中的应用及其失配影响第29-31页
   ·本文主要研究内容第31-35页
第2章 说话人识别系统第35-45页
   ·说话人识别的系统框架第35-36页
   ·语音特征第36-39页
     ·美尔倒谱系数(MFCC)第36-38页
     ·基音频率第38-39页
   ·说话人模型第39-42页
     ·高斯混合模型(GMM)第39-40页
     ·GMM-UBM-MAP结构的说话人识别第40-42页
   ·说话人识别的性能评价标准第42-44页
     ·错误接受率和错误拒绝率第42-43页
     ·等错误率(EER)和DET曲线第43-44页
   ·本章小结第44-45页
第3章 情感语音的高/低差异类的划分第45-65页
   ·情感数据库介绍第45-53页
     ·情感语音的定义及分类第45-49页
     ·情感语音数据库的现状第49-51页
     ·本文的实验语音数据库第51-53页
   ·情感语音划分的概述第53页
   ·基于识别性能差异现象的情感语音划分第53-55页
   ·基于语音特征分布的情感语音划分第55-57页
     ·不同情感语音基频分布的差异第55-57页
     ·不同情感语音MFCC分布的差异第57页
   ·基于语音特征聚类结果的情感语音划分第57-62页
     ·韵律特征的聚类结果第58-60页
     ·声学特征MFCC的聚类结果第60-62页
   ·基于人耳听辨结果的情感语音划分第62-64页
     ·实验设置第62-63页
     ·实验结果分析第63-64页
   ·本章小结第64-65页
第4章 情感变化引发的基频失配第65-83页
   ·情感语音的韵律特征偏差分析第65-71页
     ·基频偏差分析第66-68页
     ·音强偏差分析第68-70页
     ·音长偏差分析第70-71页
   ·情感变化引发的基频失配及其影响第71-74页
     ·情感影响下基频失配产生的原理第72-73页
     ·情感影响下基频失配与说话人识别性能之间的关系第73-74页
   ·基频与MFCC的关联第74-80页
     ·声道与声源的互扰第74-76页
     ·基频和MFCC之间关联的概述第76页
     ·基频与MFCC相关性的实验分析第76-78页
     ·降低基频失配对增加语音说话人之间的可区分性的作用第78-80页
   ·情感说话人识别中模式失配问题的解决思路第80-82页
   ·本章小结第82-83页
第5章 基于基频失配检测的情感屏蔽方法第83-99页
   ·算法思路第83-84页
   ·情感语音的差异检测第84-86页
     ·基于短时声学特征的差异检测第84-85页
     ·性别识别第85页
     ·基于全局韵律特征的差异检测第85-86页
     ·融合方法第86页
   ·基于基频的高失配检测第86-88页
     ·语音的分割第86-87页
     ·高失配检测第87-88页
   ·屏蔽的策略第88-90页
   ·基于情感屏蔽的说话人识别系统第90页
   ·实验结果及分析第90-98页
     ·性别识别的影响第91页
     ·差异检测的效果第91-93页
     ·高失配部分的成分分析第93-94页
     ·高失配部分与中性语音在MFCC上分布的差异第94-95页
     ·MASC库上的实验结果第95-96页
     ·EPST库上的实验结果第96-98页
   ·本章小结第98-99页
第6章 基于基频映射的情感拓展方法第99-119页
   ·算法思路第99-102页
   ·基于基频映射的虚拟高差异情感语音构建第102-105页
     ·基频均值的转换关系第102-103页
     ·多项式函数系数的确定第103-104页
     ·高差异类情感语音基频序列的构建第104-105页
     ·虚拟高差异类情感语音的合成第105页
   ·基于双模型得分可靠性加权的情感说话人识别第105-107页
     ·高失配部分的检测(G-HMD)第106页
     ·基于双模型得分可靠性加权的情感说话人识别第106-107页
   ·基于识别率的权重确定策略第107-109页
     ·合理性分析第107-108页
     ·基于识别率的权重策略第108-109页
   ·实验分析及讨论第109-117页
     ·实验设置第109页
     ·基频映射函数的最优阶数第109-110页
     ·MASC库上的实验结果第110-111页
     ·双模型方法中得分计算方式的讨论第111-112页
     ·拟合的和真实的改变幅度下方法性能的差异第112-113页
     ·EPST库上的实验效果第113-114页
     ·基于识别率的权重确定策略的有效性讨论第114-115页
     ·基频映射的可视化效果第115-116页
     ·不同情感拓展方法的比较第116-117页
   ·本章小结第117-119页
第7章 基于基频修正的情感规整方法第119-132页
   ·算法思路第119-121页
   ·高差异类情感语音基频序列的修正第121-122页
   ·基于PSOLA的基频修改第122-123页
   ·基频修正函数及其效果第123-127页
     ·基频修正函数的参数数目确定第123-124页
     ·基频修正函数的效果第124-126页
     ·基频修正的可视化效果第126-127页
   ·实验结果及分析第127-131页
     ·MASC库上的实验结果第127-129页
     ·AIC准则有效性的讨论第129页
     ·采用拟合的与真实的基频均值规整时系统性能的比较第129-130页
     ·EPST库上的实验结果第130-131页
   ·本章小结第131-132页
第8章 基于基频失配评估的得分补偿方法第132-143页
   ·算法思想第132-133页
   ·得分规整分析第133-137页
     ·得分计算第133-134页
     ·得分加权的作用域选择第134-136页
     ·基频失配与模式失配第136-137页
   ·基于基频失配评估的得分补偿方法第137-140页
     ·高失配检测第138-139页
     ·基频失配相关的得分可靠性加权函数第139-140页
     ·基于基频失配评估的得分补偿的说话人识别系统第140页
   ·实验结果及分析第140-142页
     ·MASC库上的实验结果第140-141页
     ·EPST库上的实验结果第141-142页
   ·本章小结第142-143页
第9章 分析与讨论第143-158页
   ·不同情感补偿方法的融合第143-145页
     ·MASC库上的融合效果第143-144页
     ·EPST库上的融合效果第144-145页
   ·差异检测中入耳与机器的比较第145-147页
     ·人耳听辨与机器分类下差异检测的性能比较第145-146页
     ·在两种差异检测下说话人识别的对比实验第146-147页
   ·说话人确认的性能讨论第147-154页
     ·本文方法在说话人确认下的效果第147-149页
     ·得分规整在情感说话人识别中的效果第149-152页
     ·UBM训练语料的不同对情感说话人识别系统性能的影响第152-154页
   ·发声力度问题的研究第154-157页
     ·发声力度对说话人识别的影响第154-155页
     ·发声力度实验的数据库及实验设置第155-156页
     ·发声力度变化下基频均值的变化第156页
     ·基于基频映射的多发声力度模型系统及其实验结果第156-157页
   ·本章小结第157-158页
第10章 总结与展望第158-162页
   ·总结第158-160页
   ·工作展望第160-162页
参考文献第162-180页
攻读博士学位期间主要的研究成果第180-183页
作者简介第183页

论文共183页,点击 下载论文
上一篇:机会移动网络建模与应用研究--一种社会网络分析的视角
下一篇:深亚微米芯片设计中的电源完整性相关问题研究