首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于特征变换和分类的文本无关电话语音说话人识别研究

摘要第1-5页
ABSTRACT第5-7页
目录第7-10页
第1章 绪论第10-28页
   ·说话人识别概述第10-13页
     ·简介第10页
     ·发展简史第10-13页
   ·说话人识别第13-25页
     ·说话人识别的分类和基本组成第13-15页
     ·说话人识别系统的评估手段第15-19页
     ·说话人识别研究的发展趋势第19-22页
     ·说话人识别实用化所面临的问题第22-25页
   ·论文的主要研究内容第25-28页
第2章 基于统计模型的复杂背景下说话人识别第28-54页
   ·引言第28-29页
   ·说话人识别的特征参数第29-34页
     ·语音信号的倒谱(Cepstrum)分析第30-31页
     ·Mel频率倒谱参数:MFCC第31-34页
   ·高斯混合模型(GMM)第34-40页
     ·GMM的基本结构第34-36页
     ·GMM模型的参数估计第36-38页
     ·UBM-MAP结构的说话人识别模型第38-40页
   ·统计模型在复杂背景下进行说话人识别的问题第40-44页
     ·训练和测试语音集长度对统计模型性能的影响第40-42页
     ·环境和通道失配对统计模型性能的影响第42-44页
   ·改善复杂条件下识别性能的方法第44-53页
     ·统计模型在复杂条件下的不足和问题第45-46页
     ·改善复杂条件下系统识别性能的常用方法第46-50页
     ·本文针对复杂条件下说话人识别所提出的方法第50-53页
   ·本章小结第53-54页
第3章 基于概率分布的参数规整方法第54-74页
   ·引言第54-57页
   ·多维高斯化变换(Gaussianization)的基本原理第57-58页
   ·语音参数的分段概率分布参数规整第58-64页
     ·一维数据的高斯化变换第58-60页
     ·语音参数的分段概率分布规整第60-62页
     ·分段概率分布规整前后的MFCC比较第62-63页
     ·UBM在参数规整中的作用和意义第63-64页
   ·实验结果与比较第64-72页
     ·分段概率分布规整对说话人辨认的性能影响第64-65页
     ·不同窗长对说话人识别性能的影响第65-66页
     ·概率分布规整中UBM对系统性能的影响第66-67页
     ·分段概率分布规整对复杂噪声环境下说话人确认性能的影响第67-71页
     ·分段概率分布规整对干净数据库的效果第71-72页
   ·本章小结第72-74页
第4章 基于峭度的参数规整方法第74-94页
   ·引言第74-75页
   ·峭度的物理意义第75-76页
   ·针对超高斯分布的语音参数的峭度规整第76-87页
     ·基于Sigmoid函数变换的降低峭度方法第76-79页
     ·峭度规整方法的理论证明第79-80页
     ·峭度规整对说话人识别性能的影响第80-87页
     ·峭度规整方法的优点第87页
   ·概率分布规整和峭度规整相结合方法的研究第87-92页
     ·概率分布规整之后的峭度规整第88-91页
     ·峭度规整之后的概率分布规整第91页
     ·概率分布规整和峭度规整相结合方法对说话人识别性能的影响第91-92页
   ·本章小结第92-94页
第5章 基于特征分类子空间的说话人识别第94-124页
   ·引言第94页
   ·基于特征空间分类的说话人识别方法第94-100页
     ·MFCC参数的分布第94-96页
     ·特征子空间的划分方法第96-97页
     ·分类高斯混合模型(CGMM-UBM)基本结构第97-99页
     ·CGMM-UBM结构的运算效率第99页
     ·CGMM-UBM结构的优点和需要解决的问题第99-100页
   ·分类子系统的实验结果及分析第100-108页
     ·数据库描述第100-101页
     ·语音长度对系统确认性能的影响第101-102页
     ·分类子系统的性能实验第102-105页
     ·分类空间个数的选择第105-106页
     ·分类子系统相加融合后系统性能的改进第106-108页
   ·多个子系统评分所带来的问题第108-110页
   ·基于SVM的话者确认多子系统融合方法第110-119页
     ·SVM训练的核心思想——分类间隔最大第112-113页
     ·SVM对线性不可分数据的优点第113-115页
     ·SVM核函数的选择第115页
     ·SVM融合方法的优点第115-117页
     ·SVM进行子系统融合的过程第117-119页
   ·分类子系统融合实验结果及分析第119-123页
     ·数据库描述第119页
     ·SVM融合和相加融合性能对比第119-121页
     ·SVM核函数对融合性能的影响第121页
     ·SVM融合和相加融合DET性能对比第121-123页
   ·本章小结第123-124页
第6章 基于两级维纳滤波的鲁棒性说话人识别第124-144页
   ·引言第124-125页
   ·维纳滤波的基本原理第125-128页
     ·谱减(Spectral Subtraction)第125-126页
     ·维纳滤波(Wiener Filtering)第126-128页
   ·基于维纳滤波的ETSI DSR前端标准第128-133页
     ·ETSI DSR标准的简介第128-129页
     ·ETSI DSR AFE标准的概况第129-130页
     ·ETSI DSR AFE标准中的维纳滤波降噪第130-131页
     ·维纳滤波中的VAD(Voice Activity Detection)模块第131-133页
   ·基于无监督分割方法的静音检测第133-140页
     ·ETSI DSR AFE标准中VAD的问题第133-134页
     ·基于无监督分割方法的VAD第134-137页
     ·无监督分割VAD的性能第137-140页
   ·实验结果及分析第140-143页
   ·本章小结第143-144页
第7章 总结与展望第144-148页
参考文献第148-156页
致谢第156-158页
攻读学位期间的主要研究工作和论文发表情况第158-159页

论文共159页,点击 下载论文
上一篇:中小型IT系统集成企业发展战略研究
下一篇:中国石油山东销售公司内部审计与风险管理