第一章 绪论 | 第1-13页 |
1.1、 语音识别技术 | 第6-9页 |
1.1.1、 语音命令识别研究的历史背景 | 第6页 |
1.1.2、 语音识别技术的发展现状 | 第6-7页 |
1.1.3、 语音识别系统的分类方式及结构 | 第7页 |
1.1.4、 语音识别技术内容 | 第7-9页 |
1.2、 课题中主要解决的问题 | 第9-10页 |
1.3、 整体方案的提出:基于通讯声码器的语音识别 | 第10-11页 |
1.4、 论文各部分主要内容 | 第11-13页 |
第二章 语音信号处理的基本原理 | 第13-27页 |
2.1、 语音信号产生的生理机理 | 第13-14页 |
2.2、 语音信号短时时域处理方法 | 第14-15页 |
2.3、 LPC(线性预测编码)分析技术 | 第15-27页 |
2.3.1、 LPC模型基本原理 | 第16-19页 |
2.3.2、 自相关法 | 第19-22页 |
2.3.3、 模型增益的计算 | 第22-24页 |
2.3.4、 各种LPC参数及其相互关系 | 第24-27页 |
第三章 (EFR)声码器语音分析 | 第27-39页 |
3.1、 LPC声码器原理和常用结构 | 第27-30页 |
3.2、 GSM EFR声码器基本结构和原理 | 第30-31页 |
3.3、 GSM EFR编码流程 | 第31-38页 |
3.3.1、 语音信号输入及预处理 | 第31页 |
3.3.2、 LPC分析和LP参数生成 | 第31-36页 |
3.3.3、 基音分析和自适应码本搜索 | 第36-38页 |
3.3.4、 代数码本搜索 | 第38页 |
3.4、 最终编码输出 | 第38-39页 |
第四章 基于GSM ERF编码器的语音特征选择和提取 | 第39-44页 |
4.1、 用于语音识别的特征 | 第39-40页 |
4.2、 GSM EFR编码器输出参数与中间过程变量分析 | 第40-42页 |
4.2.1、 LPC声道响应参数 | 第40-41页 |
4.2.2、 基音分析参数 | 第41页 |
4.2.3、 余量激励参数 | 第41-42页 |
4.3、 基于GSM ERF编码器的特征提取 | 第42-44页 |
第五章 模板匹配算法 | 第44-56页 |
5.1、 语音端点检测技术 | 第45-47页 |
5.2、 语音特征的相似度与畸变计算 | 第47-51页 |
5.3、 时轴对齐和规整技术(DTW) | 第51-56页 |
5.3.1、 DTW算法基本原理 | 第52-53页 |
5.3.2、 DTW路径搜索算法 | 第53-56页 |
第六章 语音模板的生成和优化 | 第56-62页 |
6.1、 问题的提出和传统的解决方法 | 第56-57页 |
6.2、 基于DTW算法的模板生成 | 第57-62页 |
6.2.1、 提高算法性能的思路 | 第57-58页 |
6.2.2、 基于DTW路径的特征平均 | 第58页 |
6.2.3、 路径回溯和特征与时轴的均匀化 | 第58-60页 |
6.2.4、 模板特征质量估计与训练优化 | 第60-62页 |
结束语 | 第62-63页 |
致谢 | 第63-64页 |
参考文献 | 第64-67页 |
附录 声码器的模块化和语音特征分析软件的编制 | 第67-69页 |