第一章 绪论 | 第1-9页 |
§1-1 语音识别概述 | 第7-8页 |
§1-2 本课题的研究背景 | 第8页 |
§1-3 本课题的主要研究内容 | 第8-9页 |
第二章 语音识别的研究与发展 | 第9-18页 |
§2-1 语音识别的发展历史 | 第9-12页 |
2-1-1 国外语音识别的发展历史 | 第9-11页 |
2-1-2 我国语音识别的发展历史 | 第11-12页 |
§2-2 语音识别系统 | 第12-13页 |
2-2-1 语音识别的类型 | 第12页 |
2-2-2 语音识别原理 | 第12-13页 |
§2-3 语音识别的主要方法和技术 | 第13-16页 |
§2-4 语音识别中存在的问题 | 第16页 |
§2-5 语音识别的发展方向与应用前景 | 第16-18页 |
2-5-1 今后语音识别技术的发展方向 | 第17页 |
2-5-2 语音识别技术的应用前景 | 第17-18页 |
第三章 语音识别系统的基本实现方法 | 第18-52页 |
§3-1 相关语音学知识 | 第18-27页 |
3-1-1 语音信号产生模型 | 第18-20页 |
3-1-2 语音信号特性及常用特征 | 第20-27页 |
§3-2 Microsoft语音识别开发工具 | 第27-29页 |
3-2-1 Microsoft Agent 2.0 | 第27-28页 |
3-2-2 Microsoft Speech SDK | 第28-29页 |
§3-3 语音识别系统的构成 | 第29-30页 |
§3-4 语音识别系统的预处理 | 第30-38页 |
3-4-1 语音采样 | 第30-31页 |
3-4-2 去除噪声 | 第31-34页 |
3-4-3 端点检测 | 第34-35页 |
3-4-4 自动增益控制(AGC) | 第35-36页 |
3-4-5 预加重 | 第36页 |
3-4-6 分帧 | 第36页 |
3-4-7 加窗 | 第36-38页 |
§3-5 语音识别的特征提取 | 第38-43页 |
3-5-1 自相关分析 | 第39-41页 |
3-5-2 语音信号的线性预测编码(LPC)分析 | 第41-43页 |
3-5-3 语音的倒谱分析 | 第43页 |
§3-6 模板训练方法 | 第43-44页 |
3-6-1 偶然性训练法 | 第44页 |
3-6-2 鲁棒性训练法 | 第44页 |
3-6-3 聚类训练法 | 第44页 |
§3-7 模板匹配方法 | 第44-52页 |
3-7-1 动态时间规整 | 第45-46页 |
3-7-2 隐马尔可夫模型 | 第46-48页 |
3-7-3 人工神经网络方法 | 第48-52页 |
第四章 语音识别系统的基本实现及算法改进 | 第52-61页 |
§4-1 课题分析 | 第52页 |
4-1-1 语音指令分析 | 第52页 |
4-1-2 适应环境噪声的要求 | 第52页 |
4-1-3 识别准确率的要求 | 第52页 |
4-1-4 实时性的要求 | 第52页 |
§4-2 孤立词、特定人、小词汇量语音识别系统 | 第52-53页 |
4-2-1 解决思路与系统模块 | 第53页 |
4-2-2 系统的软件流程图 | 第53页 |
§4-3 系统各模块的具体实现 | 第53-60页 |
4-3-1 语音的采集 | 第53-54页 |
4-3-2 语音的预处理 | 第54-56页 |
4-3-3 语音数据的特征提取 | 第56-58页 |
4-3-4 DTW方法的实现与改进 | 第58-59页 |
4-3-5 模板的制作与改进 | 第59-60页 |
§4-4 实现功能与技术指标 | 第60-61页 |
第五章 结论 | 第61-62页 |
参考文献 | 第62-64页 |
致谢 | 第64-65页 |
攻读学位期间所取得的相关科研成果 | 第65页 |