摘要 | 第5-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第12-22页 |
1.1 研究背景及意义 | 第12-15页 |
1.1.1 背景 | 第12-13页 |
1.1.2 说话人识别概述 | 第13页 |
1.1.3 说话人识别的应用 | 第13-15页 |
1.2 国内外研究现状 | 第15-16页 |
1.3 说话人识别的数据库及评价标准介绍 | 第16-19页 |
1.3.1 论文实验所用数据库介绍 | 第16-17页 |
1.3.2 实验评价标准 | 第17-19页 |
1.4 研究内容与结构安排 | 第19-22页 |
1.4.1 论文研究的主要工作 | 第19-20页 |
1.4.2 论文的结构安排 | 第20-22页 |
第二章 说话人识别原理与分析 | 第22-36页 |
2.1 相关研究 | 第22-23页 |
2.2 语音信号产生机理 | 第23-24页 |
2.3 预处理阶段 | 第24-25页 |
2.3.1 端点检测 | 第24页 |
2.3.2 分帧 | 第24-25页 |
2.3.3 预加重 | 第25页 |
2.3.4 加窗 | 第25页 |
2.4 主要特征参数提取 | 第25-31页 |
2.4.1 基频 | 第26页 |
2.4.2 能量 | 第26页 |
2.4.3 LPCC | 第26-27页 |
2.4.4 MFCC | 第27-31页 |
2.5 主流说话人识别方法—高斯混合模型-通用背景模型 | 第31-35页 |
2.5.1 高斯混合模型 | 第31-33页 |
2.5.2 GMM-UBM | 第33-35页 |
2.6 本章小结 | 第35-36页 |
第三章 一种新的语音信号特征提取方法 | 第36-52页 |
3.1 相关研究 | 第36-37页 |
3.2 S变换理论 | 第37-39页 |
3.3 基于SVD降噪方法 | 第39-43页 |
3.3.1 奇异值分解(SVD)理论 | 第39页 |
3.3.2 奇异值选取降噪原理 | 第39-40页 |
3.3.3 一种自适应的奇异值分解降噪方法 | 第40-41页 |
3.3.4 原始信号损失分析和实验 | 第41-43页 |
3.4 基于S变换与ASVD的语音时频域特征提取 | 第43-45页 |
3.5 实验与分析 | 第45-49页 |
3.5.1 实验设置 | 第45-46页 |
3.5.2 评价指标 | 第46页 |
3.5.3 实验设计与结果分析 | 第46-49页 |
3.6 本章小结 | 第49-52页 |
第四章 基于高斯混合模型超向量-支持向量机核函数研究 | 第52-62页 |
4.1 相关研究 | 第52-53页 |
4.2 GMM超向量 | 第53-54页 |
4.3 支持向量机(SVM) | 第54-57页 |
4.4 基于核函数的GSV-SVM说话人识别系统 | 第57-58页 |
4.5 实验与分析 | 第58-60页 |
4.5.1 实验设置 | 第59页 |
4.5.2 评价指标 | 第59页 |
4.5.3 实验设计与结果分析 | 第59-60页 |
4.6 本章小结 | 第60-62页 |
第五章 基于总变化因子分析中总变化因子空间估计方法研究 | 第62-74页 |
5.1 相关研究 | 第62-63页 |
5.2 因子分析方法 | 第63-65页 |
5.2.1 联合因子分析方法 | 第63-64页 |
5.2.2 总变化因子分析方法 | 第64-65页 |
5.3 总变化因子空间通用背景-联合估计算法 | 第65-68页 |
5.3.1 通用背景算法(UB) | 第66-67页 |
5.3.2 联合估计算法(JE) | 第67页 |
5.3.3 通用背景-联合估计算法 | 第67-68页 |
5.4 实验与分析 | 第68-71页 |
5.4.1 实验设置 | 第68-69页 |
5.4.2 评价指标 | 第69页 |
5.4.3 实验设计与结果分析 | 第69-71页 |
5.5 本章小结 | 第71-74页 |
第六章 系统融合的实现效果对比 | 第74-78页 |
6.1 相关研究 | 第74页 |
6.2 实验设置 | 第74页 |
6.3 评价指标 | 第74-75页 |
6.4 实验设计与结果分析 | 第75-76页 |
6.5 本章小结 | 第76-78页 |
第七章 总结与展望 | 第78-80页 |
7.1 全文总结 | 第78-79页 |
7.2 下一步工作 | 第79-80页 |
致谢 | 第80-82页 |
参考文献 | 第82-90页 |
附录A 攻读硕士期间发表论文及参与项目 | 第90页 |