致谢 | 第1-7页 |
摘要 | 第7-9页 |
Abstract | 第9-19页 |
第1章 绪论 | 第19-35页 |
·引言 | 第19-20页 |
·说话人识别概述 | 第20-22页 |
·说话人内在因素变化的影响 | 第22-25页 |
·情感说话人识别及其面临的困难 | 第25-29页 |
·基频在说话人识别中的应用及其失配影响 | 第29-31页 |
·本文主要研究内容 | 第31-35页 |
第2章 说话人识别系统 | 第35-45页 |
·说话人识别的系统框架 | 第35-36页 |
·语音特征 | 第36-39页 |
·美尔倒谱系数(MFCC) | 第36-38页 |
·基音频率 | 第38-39页 |
·说话人模型 | 第39-42页 |
·高斯混合模型(GMM) | 第39-40页 |
·GMM-UBM-MAP结构的说话人识别 | 第40-42页 |
·说话人识别的性能评价标准 | 第42-44页 |
·错误接受率和错误拒绝率 | 第42-43页 |
·等错误率(EER)和DET曲线 | 第43-44页 |
·本章小结 | 第44-45页 |
第3章 情感语音的高/低差异类的划分 | 第45-65页 |
·情感数据库介绍 | 第45-53页 |
·情感语音的定义及分类 | 第45-49页 |
·情感语音数据库的现状 | 第49-51页 |
·本文的实验语音数据库 | 第51-53页 |
·情感语音划分的概述 | 第53页 |
·基于识别性能差异现象的情感语音划分 | 第53-55页 |
·基于语音特征分布的情感语音划分 | 第55-57页 |
·不同情感语音基频分布的差异 | 第55-57页 |
·不同情感语音MFCC分布的差异 | 第57页 |
·基于语音特征聚类结果的情感语音划分 | 第57-62页 |
·韵律特征的聚类结果 | 第58-60页 |
·声学特征MFCC的聚类结果 | 第60-62页 |
·基于人耳听辨结果的情感语音划分 | 第62-64页 |
·实验设置 | 第62-63页 |
·实验结果分析 | 第63-64页 |
·本章小结 | 第64-65页 |
第4章 情感变化引发的基频失配 | 第65-83页 |
·情感语音的韵律特征偏差分析 | 第65-71页 |
·基频偏差分析 | 第66-68页 |
·音强偏差分析 | 第68-70页 |
·音长偏差分析 | 第70-71页 |
·情感变化引发的基频失配及其影响 | 第71-74页 |
·情感影响下基频失配产生的原理 | 第72-73页 |
·情感影响下基频失配与说话人识别性能之间的关系 | 第73-74页 |
·基频与MFCC的关联 | 第74-80页 |
·声道与声源的互扰 | 第74-76页 |
·基频和MFCC之间关联的概述 | 第76页 |
·基频与MFCC相关性的实验分析 | 第76-78页 |
·降低基频失配对增加语音说话人之间的可区分性的作用 | 第78-80页 |
·情感说话人识别中模式失配问题的解决思路 | 第80-82页 |
·本章小结 | 第82-83页 |
第5章 基于基频失配检测的情感屏蔽方法 | 第83-99页 |
·算法思路 | 第83-84页 |
·情感语音的差异检测 | 第84-86页 |
·基于短时声学特征的差异检测 | 第84-85页 |
·性别识别 | 第85页 |
·基于全局韵律特征的差异检测 | 第85-86页 |
·融合方法 | 第86页 |
·基于基频的高失配检测 | 第86-88页 |
·语音的分割 | 第86-87页 |
·高失配检测 | 第87-88页 |
·屏蔽的策略 | 第88-90页 |
·基于情感屏蔽的说话人识别系统 | 第90页 |
·实验结果及分析 | 第90-98页 |
·性别识别的影响 | 第91页 |
·差异检测的效果 | 第91-93页 |
·高失配部分的成分分析 | 第93-94页 |
·高失配部分与中性语音在MFCC上分布的差异 | 第94-95页 |
·MASC库上的实验结果 | 第95-96页 |
·EPST库上的实验结果 | 第96-98页 |
·本章小结 | 第98-99页 |
第6章 基于基频映射的情感拓展方法 | 第99-119页 |
·算法思路 | 第99-102页 |
·基于基频映射的虚拟高差异情感语音构建 | 第102-105页 |
·基频均值的转换关系 | 第102-103页 |
·多项式函数系数的确定 | 第103-104页 |
·高差异类情感语音基频序列的构建 | 第104-105页 |
·虚拟高差异类情感语音的合成 | 第105页 |
·基于双模型得分可靠性加权的情感说话人识别 | 第105-107页 |
·高失配部分的检测(G-HMD) | 第106页 |
·基于双模型得分可靠性加权的情感说话人识别 | 第106-107页 |
·基于识别率的权重确定策略 | 第107-109页 |
·合理性分析 | 第107-108页 |
·基于识别率的权重策略 | 第108-109页 |
·实验分析及讨论 | 第109-117页 |
·实验设置 | 第109页 |
·基频映射函数的最优阶数 | 第109-110页 |
·MASC库上的实验结果 | 第110-111页 |
·双模型方法中得分计算方式的讨论 | 第111-112页 |
·拟合的和真实的改变幅度下方法性能的差异 | 第112-113页 |
·EPST库上的实验效果 | 第113-114页 |
·基于识别率的权重确定策略的有效性讨论 | 第114-115页 |
·基频映射的可视化效果 | 第115-116页 |
·不同情感拓展方法的比较 | 第116-117页 |
·本章小结 | 第117-119页 |
第7章 基于基频修正的情感规整方法 | 第119-132页 |
·算法思路 | 第119-121页 |
·高差异类情感语音基频序列的修正 | 第121-122页 |
·基于PSOLA的基频修改 | 第122-123页 |
·基频修正函数及其效果 | 第123-127页 |
·基频修正函数的参数数目确定 | 第123-124页 |
·基频修正函数的效果 | 第124-126页 |
·基频修正的可视化效果 | 第126-127页 |
·实验结果及分析 | 第127-131页 |
·MASC库上的实验结果 | 第127-129页 |
·AIC准则有效性的讨论 | 第129页 |
·采用拟合的与真实的基频均值规整时系统性能的比较 | 第129-130页 |
·EPST库上的实验结果 | 第130-131页 |
·本章小结 | 第131-132页 |
第8章 基于基频失配评估的得分补偿方法 | 第132-143页 |
·算法思想 | 第132-133页 |
·得分规整分析 | 第133-137页 |
·得分计算 | 第133-134页 |
·得分加权的作用域选择 | 第134-136页 |
·基频失配与模式失配 | 第136-137页 |
·基于基频失配评估的得分补偿方法 | 第137-140页 |
·高失配检测 | 第138-139页 |
·基频失配相关的得分可靠性加权函数 | 第139-140页 |
·基于基频失配评估的得分补偿的说话人识别系统 | 第140页 |
·实验结果及分析 | 第140-142页 |
·MASC库上的实验结果 | 第140-141页 |
·EPST库上的实验结果 | 第141-142页 |
·本章小结 | 第142-143页 |
第9章 分析与讨论 | 第143-158页 |
·不同情感补偿方法的融合 | 第143-145页 |
·MASC库上的融合效果 | 第143-144页 |
·EPST库上的融合效果 | 第144-145页 |
·差异检测中入耳与机器的比较 | 第145-147页 |
·人耳听辨与机器分类下差异检测的性能比较 | 第145-146页 |
·在两种差异检测下说话人识别的对比实验 | 第146-147页 |
·说话人确认的性能讨论 | 第147-154页 |
·本文方法在说话人确认下的效果 | 第147-149页 |
·得分规整在情感说话人识别中的效果 | 第149-152页 |
·UBM训练语料的不同对情感说话人识别系统性能的影响 | 第152-154页 |
·发声力度问题的研究 | 第154-157页 |
·发声力度对说话人识别的影响 | 第154-155页 |
·发声力度实验的数据库及实验设置 | 第155-156页 |
·发声力度变化下基频均值的变化 | 第156页 |
·基于基频映射的多发声力度模型系统及其实验结果 | 第156-157页 |
·本章小结 | 第157-158页 |
第10章 总结与展望 | 第158-162页 |
·总结 | 第158-160页 |
·工作展望 | 第160-162页 |
参考文献 | 第162-180页 |
攻读博士学位期间主要的研究成果 | 第180-183页 |
作者简介 | 第183页 |