摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第1章 绪论 | 第10-17页 |
1.1 本课题研究的目的和意义 | 第10-11页 |
1.2 语音识别概述 | 第11-14页 |
1.2.1 语音识别的分类 | 第11页 |
1.2.2 语音识别技术国内外研究现状 | 第11-13页 |
1.2.3 语音识别技术 | 第13-14页 |
1.3 视频图像跟踪概述 | 第14-15页 |
1.4 本文研究内容及章节安排 | 第15-17页 |
第2章 语音识别的基本原理 | 第17-26页 |
2.1 语音信号预处理 | 第17-22页 |
2.1.1 语音信号的采样 | 第18页 |
2.1.2 语音信号的预加重 | 第18-19页 |
2.1.3 语音信号的分帧加窗 | 第19-20页 |
2.1.4 语音信号的端点检测 | 第20-22页 |
2.2 语音信号的特征提取 | 第22-25页 |
2.2.1 线性预测倒谱系数 | 第23页 |
2.2.2 Mel频率倒谱系数 | 第23-25页 |
2.3 本章小结 | 第25-26页 |
第3章 语音识别模型研究 | 第26-52页 |
3.1 语言模型 | 第27-33页 |
3.1.1 N-Gram统计语言模型 | 第27-28页 |
3.1.2 语言模型的评价 | 第28-29页 |
3.1.3 语言模型的平滑技术 | 第29-30页 |
3.1.4 语言模型性能提升方法 | 第30-32页 |
3.1.5 语言模型训练过程及格式 | 第32-33页 |
3.2 基于隐马尔科夫模型的声学模型研究 | 第33-44页 |
3.2.1 马尔科夫链 | 第34-35页 |
3.2.2 隐马尔科夫模型 | 第35-36页 |
3.2.3 隐马尔科夫模型的三个基本问题 | 第36-42页 |
3.2.4 高斯混合模型 | 第42-44页 |
3.3 基于深度学习的语音识别研究 | 第44-51页 |
3.3.1 基于深度信念网络的语音识别总体结构 | 第45-46页 |
3.3.2 受限制玻尔兹曼机的模型定义 | 第46-47页 |
3.3.3 受限制玻尔兹曼机的学习方法 | 第47-50页 |
3.3.4 受限制玻尔兹曼机的误差评估 | 第50页 |
3.3.5 受限制玻尔兹曼机的微调 | 第50页 |
3.3.6 深度信念网络的语音识别代码结构 | 第50-51页 |
3.4 本章小结 | 第51-52页 |
第4章 系统实现与实验分析 | 第52-65页 |
4.1 船舶操纵安全监测原型系统的设计与实现 | 第52-58页 |
4.1.1 视频图像的运动跟踪与方向判断 | 第53-56页 |
4.1.2 基于隐马尔科夫模型的车舵令语音识别系统 | 第56-57页 |
4.1.3 原型系统的初步实现 | 第57-58页 |
4.2 桌面系统的语音识别功能 | 第58-61页 |
4.2.1 航海仪器的操纵指令识别 | 第58-60页 |
4.2.2 船舶操纵模拟器桌面系统相关操作命令的识别 | 第60-61页 |
4.3 大词汇量连续语音识别的实验分析 | 第61-64页 |
4.3.1 基于隐马尔科夫模型的语音识别实验分析 | 第61-63页 |
4.3.2 基于深度信念网络的语音识别实验分析 | 第63-64页 |
4.4 本章小结 | 第64-65页 |
第5章 总结与展望 | 第65-67页 |
参考文献 | 第67-72页 |
攻读学位期间公开发表论文 | 第72-73页 |
致谢 | 第73-74页 |
作者简介 | 第74页 |