摘要 | 第3-4页 |
Abstract | 第4页 |
第一章 绪论 | 第7-12页 |
1.1 研究背景及意义 | 第7-8页 |
1.2 国内外研究现状 | 第8-9页 |
1.3 目前研究存在的问题 | 第9-10页 |
1.4 本文主要工作及论文框架 | 第10-12页 |
第二章 语音识别研究的理论及技术 | 第12-16页 |
2.1 语音识别的基本原理 | 第12页 |
2.2 语音识别方法 | 第12-14页 |
2.3 协同学 | 第14-15页 |
2.4 语音识别系统的性能评价 | 第15-16页 |
第三章 基于协同学的语音身份识别模型的构建 | 第16-22页 |
3.1 概述 | 第16页 |
3.2 基于协同学的语音识别系统的模型设计 | 第16-22页 |
3.2.1 语音信号的预处理 | 第18-19页 |
3.2.2 特征参数提取 | 第19页 |
3.2.3 基于协同学的特征参数还原及识别 | 第19-20页 |
3.2.4 识别的自学习 | 第20-22页 |
第四章 语音段的预处理 | 第22-35页 |
4.1 概述 | 第22页 |
4.2 语音信号的采样和量化 | 第22-23页 |
4.3 语音信号的预加重 | 第23-24页 |
4.4 语音信号的分帧和加窗 | 第24-26页 |
4.5 语音信号的端点检测 | 第26-29页 |
4.6 基于盲信号分离的语音去噪 | 第29-34页 |
4.6.1 盲信号分离的数学模型建立 | 第30页 |
4.6.2 盲信号分离的可解性与独立性分析 | 第30-31页 |
4.6.3 模型求解 | 第31-34页 |
4.7 小结 | 第34-35页 |
第五章 特征参数提取构造及算法设计 | 第35-44页 |
5.1 概述 | 第35-36页 |
5.2 特征参数提取及算法设计 | 第36-43页 |
5.2.1 线性预测倒谱系数提取算法 | 第36-39页 |
5.2.2 梅尔频率倒谱系数提取算法 | 第39-41页 |
5.2.3 特征参数合成算法 | 第41-43页 |
5.3 小结 | 第43-44页 |
第六章 语音身份识别构造及算法设计 | 第44-55页 |
6.1 概述 | 第44-46页 |
6.2 语音特征参数还原及关键模块的算法设计 | 第46-51页 |
6.2.1 待检语音的特征值二次构造算法 | 第46-47页 |
6.2.2 基于K-均值聚类的原型模式向量选取算法 | 第47-49页 |
6.2.3 基于协同学的特征参数还原算法 | 第49-51页 |
6.3 说话人身份识别的判定及识别 | 第51-54页 |
6.3.1 相似度计算算法 | 第51-53页 |
6.3.2 身份信息、判定算法 | 第53-54页 |
6.4 小结 | 第54-55页 |
第七章 基于协同学的语音识别仿真实验验证及分析 | 第55-64页 |
7.1 实验环境及数据 | 第55-56页 |
7.2 仿真实验结果及分析 | 第56-63页 |
7.2.1 识别算法性能分析 | 第56-57页 |
7.2.2 抗噪性 | 第57-59页 |
7.2.3 语音转换后的识别性能分析 | 第59-63页 |
7.3 小结 | 第63-64页 |
第八章 总结及下一步工作 | 第64-66页 |
8.1 工作总结 | 第64-65页 |
8.2 论文的主要研究特色及创新 | 第65页 |
8.3 下一步的主要工作 | 第65-66页 |
参考文献 | 第66-68页 |
攻读硕士期间发表的主要学术论文 | 第68-69页 |
致谢 | 第69-70页 |
附录 | 第70-72页 |