说话人识别中的特征参数提取和识别算法研究

摘要	第5-7页
Abstract	第7-9页
1 绪论	第13-29页
1.1 引言	第13页
1.2 说话人识别的研究背景与意义	第13-14页
1.3 说话人识别发展概况和研究现状	第14-17页
1.4 说话人识别系统概述	第17-25页
1.4.1 说话人识别的分类和基本组成	第17-18页
1.4.2 说话人识别的特征提取	第18-21页
1.4.3 说话人识别的主要模型	第21-24页
1.4.4 说话人识别系统的性能评价	第24-25页
1.5 论文主要研究内容与结构安排	第25-29页
1.5.1 主要研究内容	第26-27页
1.5.2 论文的结构安排	第27-29页
2 基于多层次框架的端点检测算法研究	第29-47页
2.1 引言	第29-30页
2.2 语音信号的预处理方法	第30-31页
2.2.1 预加重	第30-31页
2.2.2 分帧与加窗	第31页
2.3 端点检测的常用方法	第31-38页
2.3.1 短时能量和过零率	第32-35页
2.3.2 MFCC	第35页
2.3.3 谱熵	第35-37页
2.3.4 谐波结构信息	第37-38页
2.4 基于多层次框架的端点检测算法	第38-46页
2.4.1 框架概要	第38-39页
2.4.2 判决引导方法	第39页
2.4.3 改进的维纳滤波	第39-41页
2.4.4 投票模式	第41-42页
2.4.5 实验分析与讨论	第42-46页
2.5 本章小结	第46-47页
3 说话人识别中的鉴别性特征提取	第47-67页
3.1 引言	第47-48页
3.2 语音发音系统基本原理	第48-49页
3.3 说话人识别的常用特征	第49-52页
3.3.1 感知线性预测系数	第49-51页
3.3.2 Mel频率倒谱参数	第51-52页
3.4 基于F-ratio信息准则的鉴别性特征提取算法	第52-60页
3.4.1 不同频率区域的区分度分析	第53-54页
3.4.2 基于频带区分度的非均匀子带分布	第54-55页
3.4.3 鉴别性非均匀特征参数的提取	第55-56页
3.4.4 NUFCC与MFCC特征的提取流程对比	第56页
3.4.5 实验分析与讨论	第56-60页
3.5 单字音代表帧特征提取算法	第60-65页
3.5.1 单字音特征的提取	第60-62页
3.5.2 基于单字音特征的说话人识别系统	第62页
3.5.3 实验分析与讨论	第62-65页
3.6 本章小结	第65-67页
4 基于环域采样和集成策略的k近邻说话人识别算法研究	第67-77页
4.1 引言	第67页
4.2 集成学习	第67-69页
4.2.1 集成学习概述	第67-68页
4.2.2 Bagging方法	第68-69页
4.3 基于环域采样和集成策略的k近邻说话人识别算法	第69-73页
4.3.1 系统结构	第70页
4.3.2 基于环域的分层采样算法	第70-72页
4.3.3 集成策略	第72-73页
4.4 实验分析与讨论	第73-76页
4.4.1 基于环域的分层采样算法实验	第73-74页
4.4.2 拒识策略和识别率	第74页
4.4.3 集成算法性能	第74-75页
4.4.4 采取不同集成策略下的性能对比	第75-76页
4.5 本章小结	第76-77页
5 基于深度置信网络算法的说话人识别方法研究	第77-95页
5.1 引言	第77页
5.2 深度神经网络基本理论	第77-84页
5.2.1 深度置信网络	第79页
5.2.2 受限玻尔兹曼机	第79-82页
5.2.3 DNN的训练过程	第82-84页
5.3 基于DBN实现模型建模的说话人识别算法	第84-87页
5.3.1 算法原理	第84-85页
5.3.2 实验分析与讨论	第85-87页
5.4 基于DBN模型提取Bottleneck特征的说话人识别算法	第87-93页
5.4.1 算法原理	第87-88页
5.4.2 实验分析与讨论	第88-93页
5.5 本章小结	第93-95页
6 论文工作总结与研究展望	第95-99页
6.1 论文工作总结	第95-96页
6.2 研究展望	第96-99页
致谢	第99-101页
参考文献	第101-111页
附录	第111-112页