首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

复杂信道下的说话人识别

摘要第1-5页
Abstract第5-7页
目录第7-11页
第一章 绪论第11-24页
   ·说话人识别的应用第11-12页
   ·说话人识别的研究进展第12-13页
   ·说话人识别的分类第13-14页
   ·说话人识别的关键问题第14-24页
     ·数据库第14-18页
     ·性能评测第18-20页
     ·特征参数第20-22页
     ·模式识别模型的选择第22-23页
     ·本论文内容安排第23-24页
第二章 说话人识别的前端特征第24-37页
   ·MFCC参数的提取第24-27页
   ·特征参数提高说话人识别的方法第27-31页
     ·高阶差分参数第27页
     ·CMS第27-28页
     ·RASTA第28页
     ·高斯化第28-29页
     ·前端特征参数的顺序第29-31页
   ·动态的特征参数提取第31-35页
     ·固定帧长的特征参数抽取第31-33页
     ·结合音高和清浊音信息的倒谱参数第33-35页
   ·各种不同特征参数下实验结果比较第35-36页
     ·数据库第35页
     ·清音浊音的比较第35-36页
     ·动态参数与常规参数的比较第36页
   ·本章小结第36-37页
第三章 基于混合高斯模型的说话人识别第37-53页
   ·混合高斯函数拟合说话人特征第37-39页
   ·通用背景模型第39-44页
     ·用 LBG算法生成 GMM模型的初值第39-40页
     ·EM算法第40-43页
     ·UBM模型训练中注意的问题第43-44页
   ·说话人模型的建立第44-46页
   ·基于对数似然度函数的测试算法第46页
   ·得分的规整第46-48页
     ·目标第46-47页
     ·规整方法第47-48页
   ·采用模型距离夹角作为测试算法第48-52页
     ·模型距离的计算第48-49页
     ·模型距离夹角第49-51页
     ·性能结果第51-52页
   ·小结第52-53页
第四章 基于 SVM的说话人识别第53-74页
   ·支持向量机理论第54-58页
     ·最优分类面第54-55页
     ·线性不可分情况(广义最优分类面)第55-56页
     ·高维空间的内积运算第56-57页
     ·支持向量机第57页
     ·各种内积函数的支持向量机第57-58页
   ·说话人识别中的典型的核函数第58-62页
     ·GMM超矢量线性核函数第58-61页
     ·GLDS第61-62页
   ·模型距离在说话人识别中的应用第62-64页
   ·改进的 GMM超矢量第64-68页
     ·相关 MAP中不同相关系数的选择第65-66页
     ·权重参数在说话人识别中的作用第66-67页
     ·支持向量机参数的规整第67-68页
   ·正例及负例样本的平衡第68-72页
     ·基于模型距离的冒认者选择第69-70页
     ·层次化支持向量冒认者选择第70-71页
     ·通过语音切分来增加正例第71-72页
   ·总结第72-74页
第五章 复杂电话信道的处理第74-101页
   ·复杂信道情况下的说话人超矢量第76-79页
     ·KPCA分析第76-77页
     ·说话人超矢量的映射第77-79页
   ·典型的信道解决方案第79-87页
     ·特征映射第79-80页
     ·说话人模型合成第80-81页
     ·NAP第81-83页
     ·因子分析第83-87页
   ·在均值超矢量空间去估计信道空间第87-94页
     ·利用盲信道的EM聚类第87-90页
     ·利用 PCA估计信道空间第90-92页
     ·改进的NAP估计第92-94页
   ·改进的因子分析第94-99页
     ·信道空间估计第95-97页
     ·特征映射第97-98页
     ·与支持向量机的结合第98-99页
   ·总结第99-101页
第六章 结束语第101-104页
   ·本论文工作总结第101-102页
   ·进一步的研究工作第102-104页
参考文献第104-111页
攻读博士学位期间发表的论文和参与的研究工作第111-113页
 发表论文第111页
 研究工作第111-113页
致谢第113页

论文共113页,点击 下载论文
上一篇:京津客运专线短期客流预测研究
下一篇:磁控溅射装置中电磁场分布及粒子运动行为的计算分析