摘要 | 第4-5页 |
Abstract | 第5页 |
第一章 绪论 | 第10-20页 |
1.1 引言 | 第10-12页 |
1.2 语音识别技术研究及现状 | 第12-19页 |
1.2.1 语音识别技术的历史发展及其现状 | 第13-16页 |
1.2.2 语音识别技术介绍 | 第16-17页 |
1.2.3 语音唤醒技术介绍 | 第17-19页 |
1.3 本文主要工作 | 第19页 |
1.4 本文结构安排 | 第19-20页 |
第二章 语音识别系统概述 | 第20-52页 |
2.1 引言 | 第20-21页 |
2.2 语音预处理及特征提取 | 第21-27页 |
2.2.1 语音数字化表示 | 第21-22页 |
2.2.2 端点检测 | 第22-24页 |
2.2.3 特征提取 | 第24-27页 |
2.3 GMM-HMM | 第27-38页 |
2.3.1 GMM简介 | 第27-29页 |
2.3.2 HMM简介 | 第29-32页 |
2.3.3 GMM-HMM相关算法 | 第32-38页 |
2.4 深度神经网络 | 第38-45页 |
2.4.1 DNN框架 | 第38-40页 |
2.4.2 反向传播算法 | 第40-43页 |
2.4.3 神经网络相关参数 | 第43-45页 |
2.5 DNN-HMM框架 | 第45-47页 |
2.5.1 解码过程 | 第46-47页 |
2.5.2 训练过程 | 第47页 |
2.6 语言模型 | 第47-49页 |
2.7 命令词识别系统 | 第49-51页 |
2.8 本章小结 | 第51-52页 |
第三章 基于Keyword/Filler HMM的语音唤醒系统 | 第52-64页 |
3.1 引言 | 第52页 |
3.2 系统整体框架 | 第52-53页 |
3.3 数据集 | 第53-54页 |
3.4 数据处理 | 第54-55页 |
3.5 声学模型训练 | 第55-60页 |
3.5.1 大规模通用声学模型 | 第55-57页 |
3.5.2 专用唤醒词声学模型 | 第57-60页 |
3.6 实验结果及分析 | 第60-63页 |
3.7 本章小结 | 第63-64页 |
第四章 基于置信度的语音唤醒系统 | 第64-86页 |
4.1 引言 | 第64页 |
4.2 系统整体框架 | 第64-65页 |
4.3 解码 | 第65-76页 |
4.3.1 FST | 第65-70页 |
4.3.2 HCLG | 第70-72页 |
4.3.3 Lattice | 第72-76页 |
4.4 置信度 | 第76-78页 |
4.4.1 专用唤醒词系统置信度计算 | 第76-77页 |
4.4.2 可定制唤醒词系统置信度计算 | 第77-78页 |
4.5 TDNN | 第78-80页 |
4.6 实验结果及分析 | 第80-84页 |
4.7 本章小结 | 第84-86页 |
第五章 手机语音助手唤醒模块 | 第86-92页 |
5.1 工程简介 | 第86页 |
5.2 工程框架 | 第86-87页 |
5.3 工程优化及SDK说明 | 第87-89页 |
5.3.1 工程优化 | 第87-88页 |
5.3.2 SDK说明 | 第88-89页 |
5.4 工程总结 | 第89-92页 |
第六章 全文总结及工作展望 | 第92-94页 |
参考文献 | 第94-98页 |
攻读硕士期间的科研成果 | 第98-100页 |
致谢 | 第100页 |