噪声环境下的说话人识别技术

摘要	第3-4页
Abstract	第4页
1 绪论	第9-19页
1.1 引言	第9页
1.2 研究背景与意义	第9-11页
1.3 说话人识别的发展	第11-12页
1.4 说话人识别系统概述	第12-15页
1.4.1 说话人识别的分类和基本组成	第12-13页
1.4.2 说话人识别的特征选取	第13-14页
1.4.3 说话人识别的主要方法	第14-15页
1.5 噪声环境下的说话人识别研究现状及难点	第15-18页
1.5.1 噪声的分类及影响	第16页
1.5.2 噪声环境下说话人识别的基本方法	第16-18页
1.5.3 噪声环境下的研究难点	第18页
1.6 本文的组织结构安排	第18-19页
2 说话人识别基本原理	第19-34页
2.1 语音信号预处理	第19-24页
2.1.1 语音信号的预加重	第19-20页
2.1.2 语音信号的分帧和加窗	第20-22页
2.1.3 语音信号的端点检测	第22-24页
2.2 语音信号特征参数的提取	第24-30页
2.2.1 线性预测系数LPC	第25-26页
2.2.2 线性预测倒谱系数LPCC	第26-27页
2.2.3 梅尔频率倒谱系数MFCC	第27-28页
2.2.4 感知线性预测倒谱系数PLPC	第28-30页
2.3 高斯混合模型GMM	第30-33页
2.3.1 GMM模型的基本概念	第30-31页
2.3.2 GMM模型的参数估计	第31-32页
2.3.3 GMM模型参数初始化	第32页
2.3.4 GMM模型的识别问题	第32-33页
2.4 本章小结	第33-34页
3 语音信号的端点检测技术及其改进	第34-41页
3.1 基于CO复杂度的端点检测	第34-35页
3.2 基于MFCC相似度的端点检测	第35-36页
3.3 基于改进C0复杂度和MFCC相似度相结合的端点检测	第36页
3.4 三种端点检测算法的对比实验	第36-40页
3.4.1 实验准备	第36页
3.4.2 实验结果分析	第36-40页
3.4.3 实验小结	第40页
3.5 本章小结	第40-41页
4 信号空间抗噪技术的改进及对识别性能的影响	第41-56页
4.1 谱减法	第41-43页
4.1.1 基本谱减法	第41-42页
4.1.2 基本谱减法的改进	第42-43页
4.2 维纳滤波法	第43-45页
4.2.1 传统的维纳滤波法	第43-44页
4.2.2 基于先验信噪比估计的维纳滤波法	第44-45页
4.3 改进的维纳滤波法	第45-46页
4.4 语音增强方法的性能评价标准	第46-47页
4.4.1 信噪比	第46-47页
4.4.2 失真测度	第47页
4.5 语音增强算法的抗噪性能对比试验	第47-52页
4.5.1 实验准备	第47页
4.5.2 实验分析	第47-52页
4.5.3 实验小结	第52页
4.6 语音增强算法的识别性能对比实验	第52-55页
4.6.1 实验准备	第53页
4.6.2 实验分析	第53-54页
4.6.3 实验小结	第54-55页
4.7 本章小结	第55-56页
5 特征空间抗噪技术的改进及对识别性能的影响	第56-64页
5.1 梅尔频率倒谱系数的相关参数及改进	第56-58页
5.1.1 MFCC参数	第56页
5.1.2 MFCC参数的扩展及改进	第56-58页
5.2 PLPC参数的扩展及改进	第58-60页
5.2.1 感知线性预测系数PLPC	第58页
5.2.2 感知对数面积比PLAR	第58-60页
5.2.3 改进的感知对数面积比mPLAR	第60页
5.3 mMFCC_D_D与mPLAR的特征融合	第60-62页
5.3.1 串行特征融合	第61页
5.3.2 主成份分析(PCA)	第61-62页
5.4 特征参数的识别性能对比实验	第62-63页
5.4.1 实验准备	第62页
5.4.2 说话人识别率对比分析	第62-63页
5.4.3 实验小结	第63页
5.5 本章小结	第63-64页
6 总结及展望	第64-65页
致谢	第65-66页
参考文献	第66-69页
附录	第69页