摘要 | 第5-6页 |
Abstract | 第6页 |
第一章 绪论 | 第11-21页 |
1.1 课题的研究背景和意义 | 第11页 |
1.2 研究背景 | 第11-12页 |
1.3 现状和研究背景 | 第12-16页 |
1.3.1 说话人识别的法展现状 | 第12-14页 |
1.3.2 说话人识别的难点 | 第14-16页 |
1.4 说话人识别的机制 | 第16-19页 |
1.4.1 说话人识别的基本流程图介绍 | 第16-17页 |
1.4.2 语音信号的特征参数 | 第17-19页 |
1.5 本文的工作安排 | 第19-21页 |
第二章 语音信号的基本理论 | 第21-45页 |
2.1 基本概念 | 第21-22页 |
2.1.1 人的发声音机理 | 第21页 |
2.1.2 人的发声分类 | 第21-22页 |
2.2 语音信号的基本模型分析 | 第22-25页 |
2.2.1 语音信号的数字模型 | 第22页 |
2.2.2 语音信号的声学模型 | 第22-25页 |
2.3 说话人识别的概述 | 第25-28页 |
2.3.1 发音原理 | 第25-27页 |
2.3.2 说话人识别系统的性能评价标准 | 第27页 |
2.3.3 说话人识别技术的应用 | 第27-28页 |
2.4 语音信号的预处理 | 第28-36页 |
2.4.1 语音信号的采集以及量化 | 第28-30页 |
2.4.2 预加重处理 | 第30页 |
2.4.3 信号帧数分离和加窗 | 第30-33页 |
2.4.4 语音信号的端点检测 | 第33-34页 |
2.4.5 端点检测算法 | 第34页 |
2.4.6 端点检测算法的改进 | 第34-36页 |
2.5 语音信号模型的分析 | 第36-43页 |
2.5.1 说话人模型的类别 | 第36页 |
2.5.2 VQ(矢量量化)模型 | 第36-41页 |
2.5.3 高斯混合模型 | 第41-42页 |
2.5.4 人工神经网络模型 | 第42-43页 |
2.6 本章总结 | 第43-45页 |
第三章 说话人特征提取算法的分析及研究 | 第45-57页 |
3.1 常用的特征参数提取的分析 | 第45-50页 |
3.1.1 常见的特征参数提取方法介绍 | 第45页 |
3.1.2 线性预测倒谱系数(LPCC)的基本概念 | 第45-46页 |
3.1.3 LPCC特征参数分析 | 第46页 |
3.1.4 线性预测倒谱系数的特征参数提取 | 第46-50页 |
3.2 梅尔倒谱系数算法的基本原理 | 第50-55页 |
3.2.1 梅尔倒谱系数的提取过程 | 第51-55页 |
3.3 本章小结 | 第55-57页 |
第四章 语音信号识别算法原理介绍 | 第57-67页 |
4.1 概述 | 第57-58页 |
4.2 动态时间规整算法 | 第58-62页 |
4.2.1 动态时间规整算法的介绍 | 第58-60页 |
4.2.2 改进的动态时间规整算法 | 第60页 |
4.2.3 放宽端点限制 | 第60-62页 |
4.3 高斯混合模型 | 第62-66页 |
4.3.1 高斯混合模型的概述 | 第62-63页 |
4.3.2 高斯混合模型的原理 | 第63-64页 |
4.3.3 高斯混合模型的训练 | 第64-66页 |
4.5 本章总结 | 第66-67页 |
第五章 具体的实验及计算机仿真 | 第67-85页 |
5.1 基于LPCC和MFCC的混合特征参数提取的算法改进 | 第67-75页 |
5.1.1 改进算法的原理分析 | 第67页 |
5.1.2 语音信号的预处理 | 第67页 |
5.1.3 线性预测倒谱系数分析 | 第67-68页 |
5.1.4 MFCC参数的提取 | 第68-69页 |
5.1.5 LPCC和MFCC的特征参数提取的原理及分析 | 第69-70页 |
5.1.6 实验及仿真 | 第70-75页 |
5.2 基于DTW改进算法的孤立词识别系统的分析及研究 | 第75-84页 |
5.2.1 改进的孤立词识别系统的概述 | 第75页 |
5.2.2 孤立词识别系统的模型建立 | 第75-76页 |
5.2.3 孤立词的预处理过程分析 | 第76-80页 |
5.2.4 语音信号的特征提取 | 第80-82页 |
5.2.5 动态时间规整的算法改进 | 第82-83页 |
5.2.6 实验及仿真 | 第83-84页 |
5.3 本章小结 | 第84-85页 |
第六章 论文小结 | 第85-87页 |
致谢 | 第87-89页 |
参考文献 | 第89-93页 |
附录 (攻读硕士学位期间论文) | 第93页 |