首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

文本无关短语音说话人识别技术研究

目录第1-7页
表目录第7-8页
图目录第8-10页
摘要第10-12页
ABSTRACT第12-15页
第一章 绪论第15-24页
   ·说话人识别的基本概念第15-16页
   ·说话人识别的研究进展第16-17页
   ·短语音说话人识别的研究现状第17-21页
   ·论文的来源及主要研究内容第21-22页
   ·本文结构安排第22-24页
第二章 主流的说话人识别方法概述及性能分析第24-46页
   ·说话人识别原理简介第24-25页
   ·美尔频率倒谱系数第25-28页
   ·基于GMM-UBM模型的说话人识别第28-32页
     ·GMM的简介第28-29页
     ·GMM-UBM的训练:EM算法第29-30页
     ·GMM-UBM的训练:MAP自适应第30-31页
     ·GMM-UBM的似然比得分第31-32页
   ·基于SVM模型的说话人识别第32-37页
     ·SVM的简介第32-35页
     ·基于SVM的说话人识别架构第35-36页
     ·SVM的输出判决策略第36页
     ·SVM在说话人识别中应用面临的问题第36-37页
   ·基于GSV-SVM模型的说话人识别第37-40页
   ·基于MFCC的说话人识别模型在短语音条件下应用的不足第40-41页
   ·GMM-UBM和GSV-SVM的识别性能与分析第41-45页
     ·实验数据库第41页
     ·性能评估指标第41-43页
     ·实验结果与分析第43-45页
   ·总结第45-46页
第三章 基于语义信息抑制的短语音说话人辨认第46-65页
   ·已有的语义信息分离方法第46-50页
     ·已有的基于PCA的语义信息分离方法第47-49页
     ·已有的基于LDA的语义信息抑制方法第49-50页
   ·语音信号的内蕴非线性结构分析第50-52页
   ·拉普拉斯本征映射及其在语音信号处理中的应用第52-55页
     ·拉普拉斯本征映射第52-53页
     ·局部保距投影(LPP)第53-54页
     ·区分性局部保距投影(DLPP)第54-55页
   ·基于说话人属性约束的局部保距投影第55-59页
     ·SAC-LPP变换的基本原理第55页
     ·SAC-LPP变换的数学描述第55-57页
     ·SAC-LPP变换矩阵的推导第57-59页
   ·SAC-LPP在GMM-UBM模型中的应用第59-60页
   ·SAC-LPP中类间近邻以及目标函数的选择第60-61页
   ·实验结果与分析第61-64页
     ·测试结果与分析第61-63页
     ·SAC-LPP变换在说话人识别中的可行性分析第63-64页
   ·总结第64-65页
第四章 基于UBM混元子空间的短语音说话人确认第65-85页
   ·已有的基于音素信息的文本无关说话人识别方法第65-69页
     ·基于广义音素分类的说话人识别第66-68页
     ·基于单音素的说话人识别第68-69页
   ·基于S-GSV-SVM的说话人确认原理第69-73页
   ·基于层级聚类的UBM混元子空间分类方法第73-77页
     ·常用的高斯混元间的测度第73-74页
     ·基于层级聚类的高斯混元分类方法第74-77页
   ·基于双重可信度的子空间融合方法研究第77-81页
     ·子空间融合方法研究第77-78页
     ·基于自适应匹配度的可信度度量方法第78-79页
     ·基于模型推广性的可信度度量方法第79-81页
     ·基于双重可信度线性子空间融合方法第81页
   ·实验与结果分析第81-84页
     ·子空间划分方法对识别性能影响的实验第82-83页
     ·多子空间融合方法的实验与分析第83-84页
   ·总结第84-85页
第五章 基于仿生模式识别的说话人激励源特征建模方法第85-101页
   ·已有的基于原始语音的激励源特征提取方法第85-86页
   ·已有的基于LP残差的说话人识别方法第86-88页
   ·短语音条件下基于LP残差的说话人识别研究第88-89页
   ·基于LP残差向量和BNN的说话人识别第89-94页
     ·仿生模式识别的基本原理第89-90页
     ·基于仿生模式识别的神经网络构造方法第90-93页
     ·相关参数的设置及判决策略第93-94页
   ·两种特征融合方法研究第94-97页
     ·基于可靠性的动态融合方法第94-96页
     ·基于特征区分性的静态融合方法第96-97页
   ·实验与结果分析第97-100页
     ·基于LP残差向量和BNN的识别性能分析第97-98页
     ·激励源特征和MFCC融合后的识别性能第98-99页
     ·与其他短时倒谱特征融合的识别性能比较第99-100页
   ·总结第100-101页
第六章 结束语第101-104页
   ·本文的创新性研究成果第101-102页
   ·本文的局限性及下一步工作第102-104页
参考文献第104-116页
作者简历 攻读博士学位期间完成的主要工作第116-118页
致谢第118-119页

论文共119页,点击 下载论文
上一篇:多用户MIMO系统预编码技术研究
下一篇:“冬病夏治”—中医“治未病”的理论与实践