复杂信道下的说话人识别
摘要 | 第1-5页 |
Abstract | 第5-7页 |
目录 | 第7-11页 |
第一章 绪论 | 第11-24页 |
·说话人识别的应用 | 第11-12页 |
·说话人识别的研究进展 | 第12-13页 |
·说话人识别的分类 | 第13-14页 |
·说话人识别的关键问题 | 第14-24页 |
·数据库 | 第14-18页 |
·性能评测 | 第18-20页 |
·特征参数 | 第20-22页 |
·模式识别模型的选择 | 第22-23页 |
·本论文内容安排 | 第23-24页 |
第二章 说话人识别的前端特征 | 第24-37页 |
·MFCC参数的提取 | 第24-27页 |
·特征参数提高说话人识别的方法 | 第27-31页 |
·高阶差分参数 | 第27页 |
·CMS | 第27-28页 |
·RASTA | 第28页 |
·高斯化 | 第28-29页 |
·前端特征参数的顺序 | 第29-31页 |
·动态的特征参数提取 | 第31-35页 |
·固定帧长的特征参数抽取 | 第31-33页 |
·结合音高和清浊音信息的倒谱参数 | 第33-35页 |
·各种不同特征参数下实验结果比较 | 第35-36页 |
·数据库 | 第35页 |
·清音浊音的比较 | 第35-36页 |
·动态参数与常规参数的比较 | 第36页 |
·本章小结 | 第36-37页 |
第三章 基于混合高斯模型的说话人识别 | 第37-53页 |
·混合高斯函数拟合说话人特征 | 第37-39页 |
·通用背景模型 | 第39-44页 |
·用 LBG算法生成 GMM模型的初值 | 第39-40页 |
·EM算法 | 第40-43页 |
·UBM模型训练中注意的问题 | 第43-44页 |
·说话人模型的建立 | 第44-46页 |
·基于对数似然度函数的测试算法 | 第46页 |
·得分的规整 | 第46-48页 |
·目标 | 第46-47页 |
·规整方法 | 第47-48页 |
·采用模型距离夹角作为测试算法 | 第48-52页 |
·模型距离的计算 | 第48-49页 |
·模型距离夹角 | 第49-51页 |
·性能结果 | 第51-52页 |
·小结 | 第52-53页 |
第四章 基于 SVM的说话人识别 | 第53-74页 |
·支持向量机理论 | 第54-58页 |
·最优分类面 | 第54-55页 |
·线性不可分情况(广义最优分类面) | 第55-56页 |
·高维空间的内积运算 | 第56-57页 |
·支持向量机 | 第57页 |
·各种内积函数的支持向量机 | 第57-58页 |
·说话人识别中的典型的核函数 | 第58-62页 |
·GMM超矢量线性核函数 | 第58-61页 |
·GLDS | 第61-62页 |
·模型距离在说话人识别中的应用 | 第62-64页 |
·改进的 GMM超矢量 | 第64-68页 |
·相关 MAP中不同相关系数的选择 | 第65-66页 |
·权重参数在说话人识别中的作用 | 第66-67页 |
·支持向量机参数的规整 | 第67-68页 |
·正例及负例样本的平衡 | 第68-72页 |
·基于模型距离的冒认者选择 | 第69-70页 |
·层次化支持向量冒认者选择 | 第70-71页 |
·通过语音切分来增加正例 | 第71-72页 |
·总结 | 第72-74页 |
第五章 复杂电话信道的处理 | 第74-101页 |
·复杂信道情况下的说话人超矢量 | 第76-79页 |
·KPCA分析 | 第76-77页 |
·说话人超矢量的映射 | 第77-79页 |
·典型的信道解决方案 | 第79-87页 |
·特征映射 | 第79-80页 |
·说话人模型合成 | 第80-81页 |
·NAP | 第81-83页 |
·因子分析 | 第83-87页 |
·在均值超矢量空间去估计信道空间 | 第87-94页 |
·利用盲信道的EM聚类 | 第87-90页 |
·利用 PCA估计信道空间 | 第90-92页 |
·改进的NAP估计 | 第92-94页 |
·改进的因子分析 | 第94-99页 |
·信道空间估计 | 第95-97页 |
·特征映射 | 第97-98页 |
·与支持向量机的结合 | 第98-99页 |
·总结 | 第99-101页 |
第六章 结束语 | 第101-104页 |
·本论文工作总结 | 第101-102页 |
·进一步的研究工作 | 第102-104页 |
参考文献 | 第104-111页 |
攻读博士学位期间发表的论文和参与的研究工作 | 第111-113页 |
发表论文 | 第111页 |
研究工作 | 第111-113页 |
致谢 | 第113页 |