摘要 | 第1-4页 |
ABSTRACT | 第4-9页 |
第一章 引言 | 第9-16页 |
1.1 说话人识别技术概述 | 第9-10页 |
1.2 说话人识别中存在的问题 | 第10-11页 |
1.3 基于声门的说话人特征 | 第11-13页 |
1.4 研究意义 | 第13-14页 |
1.5 本文内容安排 | 第14-16页 |
第二章 说话人识别与语音库 | 第16-29页 |
2.1 背景知识 | 第16-17页 |
2.2 说话人识别系统结构 | 第17-25页 |
2.2.1 特征提取 | 第18-21页 |
2.2.2 说话人识别模型 | 第21-25页 |
2.3 实验语音数据库介绍 | 第25-27页 |
2.3.1 YOHO语音数据库 | 第25-26页 |
2.3.2 SRMC语音数据库 | 第26-27页 |
2.3.3 NOISEX-92数据库 | 第27页 |
2.4 基本参数设置 | 第27-28页 |
2.5 本章小结 | 第28-29页 |
第三章 基于声门特征的说话人识别研究现状 | 第29-37页 |
3.1 声门特征应用于说话人识别 | 第29-33页 |
3.1.1 直接使用声门特征 | 第29-31页 |
3.1.2 声门特征与倒谱特征的短时融合 | 第31-32页 |
3.1.3 声门特征与倒谱特征的长时结合 | 第32-33页 |
3.2 基音周期的提取 | 第33-36页 |
3.2.1 SHR提取方法 | 第33-36页 |
3.3 本章小结 | 第36-37页 |
第四章 基于声门特征的倒谱补偿算法 | 第37-55页 |
4.1 声门特征对于倒谱特征的影响 | 第37-41页 |
4.2 基于声门特征的倒谱补偿模型 | 第41-47页 |
4.2.1 倒谱补偿算法 | 第41-42页 |
4.2.2 实验结果及分析 | 第42-47页 |
4.3 多通道环境下的倒谱补偿 | 第47-54页 |
4.3.1 声门特征对于信道的鲁棒性 | 第48-49页 |
4.3.2 多通道环境下的倒谱补偿算法 | 第49-51页 |
4.3.3 实验结果及分析 | 第51-54页 |
4.4 本章小结 | 第54-55页 |
第五章 基于声门特征的并行高斯混合模型 | 第55-63页 |
5.1 并行高斯混合模型的理论框架 | 第55-56页 |
5.2 并行高斯混合模型的子空间划分 | 第56-58页 |
5.3 子空间模型的融合 | 第58页 |
5.4 实验结果及分析 | 第58-62页 |
5.4.1 说话人识别系统结构 | 第58-59页 |
5.4.2 实验数据及分析 | 第59页 |
5.4.3 YOHO语音库上实验 | 第59-60页 |
5.4.4 SRMC语音库上实验 | 第60-61页 |
5.4.5 并行高斯混合模型和传统高斯混合模型的融合 | 第61-62页 |
5.5 本章小结 | 第62-63页 |
第六章 基于声门特征的倒谱平均减 | 第63-71页 |
6.1 倒谱平均减技术 | 第63-65页 |
6.1.1 倒谱平均减基础 | 第63-64页 |
6.1.2 两阶倒谱平均减 | 第64页 |
6.1.3 MMCMNFW技术 | 第64-65页 |
6.2 基于声门特征的倒谱平均减 | 第65-67页 |
6.2.1 基于声门特征的倒谱平均减的动机 | 第65页 |
6.2.2 基于声门特征的倒谱平均减算法实现 | 第65-67页 |
6.3 实验部分 | 第67-70页 |
6.3.1 实验数据库选用 | 第67页 |
6.3.2 对比实验系统 | 第67页 |
6.3.3 结果及分析 | 第67-70页 |
6.4 本章小结 | 第70-71页 |
第七章 总结与展望 | 第71-74页 |
7.1 工作总结 | 第71-72页 |
7.2 讨论与展望 | 第72-74页 |
参考文献 | 第74-80页 |
攻读硕士学位期间的研究成果 | 第80-81页 |
致谢 | 第81页 |