摘要 | 第1-5页 |
ABSTRACT | 第5-7页 |
目录 | 第7-10页 |
第1章 绪论 | 第10-28页 |
·说话人识别概述 | 第10-13页 |
·简介 | 第10页 |
·发展简史 | 第10-13页 |
·说话人识别 | 第13-25页 |
·说话人识别的分类和基本组成 | 第13-15页 |
·说话人识别系统的评估手段 | 第15-19页 |
·说话人识别研究的发展趋势 | 第19-22页 |
·说话人识别实用化所面临的问题 | 第22-25页 |
·论文的主要研究内容 | 第25-28页 |
第2章 基于统计模型的复杂背景下说话人识别 | 第28-54页 |
·引言 | 第28-29页 |
·说话人识别的特征参数 | 第29-34页 |
·语音信号的倒谱(Cepstrum)分析 | 第30-31页 |
·Mel频率倒谱参数:MFCC | 第31-34页 |
·高斯混合模型(GMM) | 第34-40页 |
·GMM的基本结构 | 第34-36页 |
·GMM模型的参数估计 | 第36-38页 |
·UBM-MAP结构的说话人识别模型 | 第38-40页 |
·统计模型在复杂背景下进行说话人识别的问题 | 第40-44页 |
·训练和测试语音集长度对统计模型性能的影响 | 第40-42页 |
·环境和通道失配对统计模型性能的影响 | 第42-44页 |
·改善复杂条件下识别性能的方法 | 第44-53页 |
·统计模型在复杂条件下的不足和问题 | 第45-46页 |
·改善复杂条件下系统识别性能的常用方法 | 第46-50页 |
·本文针对复杂条件下说话人识别所提出的方法 | 第50-53页 |
·本章小结 | 第53-54页 |
第3章 基于概率分布的参数规整方法 | 第54-74页 |
·引言 | 第54-57页 |
·多维高斯化变换(Gaussianization)的基本原理 | 第57-58页 |
·语音参数的分段概率分布参数规整 | 第58-64页 |
·一维数据的高斯化变换 | 第58-60页 |
·语音参数的分段概率分布规整 | 第60-62页 |
·分段概率分布规整前后的MFCC比较 | 第62-63页 |
·UBM在参数规整中的作用和意义 | 第63-64页 |
·实验结果与比较 | 第64-72页 |
·分段概率分布规整对说话人辨认的性能影响 | 第64-65页 |
·不同窗长对说话人识别性能的影响 | 第65-66页 |
·概率分布规整中UBM对系统性能的影响 | 第66-67页 |
·分段概率分布规整对复杂噪声环境下说话人确认性能的影响 | 第67-71页 |
·分段概率分布规整对干净数据库的效果 | 第71-72页 |
·本章小结 | 第72-74页 |
第4章 基于峭度的参数规整方法 | 第74-94页 |
·引言 | 第74-75页 |
·峭度的物理意义 | 第75-76页 |
·针对超高斯分布的语音参数的峭度规整 | 第76-87页 |
·基于Sigmoid函数变换的降低峭度方法 | 第76-79页 |
·峭度规整方法的理论证明 | 第79-80页 |
·峭度规整对说话人识别性能的影响 | 第80-87页 |
·峭度规整方法的优点 | 第87页 |
·概率分布规整和峭度规整相结合方法的研究 | 第87-92页 |
·概率分布规整之后的峭度规整 | 第88-91页 |
·峭度规整之后的概率分布规整 | 第91页 |
·概率分布规整和峭度规整相结合方法对说话人识别性能的影响 | 第91-92页 |
·本章小结 | 第92-94页 |
第5章 基于特征分类子空间的说话人识别 | 第94-124页 |
·引言 | 第94页 |
·基于特征空间分类的说话人识别方法 | 第94-100页 |
·MFCC参数的分布 | 第94-96页 |
·特征子空间的划分方法 | 第96-97页 |
·分类高斯混合模型(CGMM-UBM)基本结构 | 第97-99页 |
·CGMM-UBM结构的运算效率 | 第99页 |
·CGMM-UBM结构的优点和需要解决的问题 | 第99-100页 |
·分类子系统的实验结果及分析 | 第100-108页 |
·数据库描述 | 第100-101页 |
·语音长度对系统确认性能的影响 | 第101-102页 |
·分类子系统的性能实验 | 第102-105页 |
·分类空间个数的选择 | 第105-106页 |
·分类子系统相加融合后系统性能的改进 | 第106-108页 |
·多个子系统评分所带来的问题 | 第108-110页 |
·基于SVM的话者确认多子系统融合方法 | 第110-119页 |
·SVM训练的核心思想——分类间隔最大 | 第112-113页 |
·SVM对线性不可分数据的优点 | 第113-115页 |
·SVM核函数的选择 | 第115页 |
·SVM融合方法的优点 | 第115-117页 |
·SVM进行子系统融合的过程 | 第117-119页 |
·分类子系统融合实验结果及分析 | 第119-123页 |
·数据库描述 | 第119页 |
·SVM融合和相加融合性能对比 | 第119-121页 |
·SVM核函数对融合性能的影响 | 第121页 |
·SVM融合和相加融合DET性能对比 | 第121-123页 |
·本章小结 | 第123-124页 |
第6章 基于两级维纳滤波的鲁棒性说话人识别 | 第124-144页 |
·引言 | 第124-125页 |
·维纳滤波的基本原理 | 第125-128页 |
·谱减(Spectral Subtraction) | 第125-126页 |
·维纳滤波(Wiener Filtering) | 第126-128页 |
·基于维纳滤波的ETSI DSR前端标准 | 第128-133页 |
·ETSI DSR标准的简介 | 第128-129页 |
·ETSI DSR AFE标准的概况 | 第129-130页 |
·ETSI DSR AFE标准中的维纳滤波降噪 | 第130-131页 |
·维纳滤波中的VAD(Voice Activity Detection)模块 | 第131-133页 |
·基于无监督分割方法的静音检测 | 第133-140页 |
·ETSI DSR AFE标准中VAD的问题 | 第133-134页 |
·基于无监督分割方法的VAD | 第134-137页 |
·无监督分割VAD的性能 | 第137-140页 |
·实验结果及分析 | 第140-143页 |
·本章小结 | 第143-144页 |
第7章 总结与展望 | 第144-148页 |
参考文献 | 第148-156页 |
致谢 | 第156-158页 |
攻读学位期间的主要研究工作和论文发表情况 | 第158-159页 |