致谢 | 第5-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7-8页 |
序言 | 第9-10页 |
目录 | 第10-12页 |
1 引言 | 第12-15页 |
1.1 论文背景 | 第12-13页 |
1.2 论文主要完成工作 | 第13页 |
1.3 论文结构安排 | 第13-15页 |
2 连续语音识别及HADOOP平台应用 | 第15-31页 |
2.1 语音识别的发展及基本原理 | 第15-16页 |
2.2 特征提取 | 第16-17页 |
2.3 声学模型建模 | 第17页 |
2.4 神经网络模型 | 第17-19页 |
2.5 基于深层神经网络的模型 | 第19-20页 |
2.6 识别性能表示 | 第20页 |
2.7 HADOOP概述 | 第20-22页 |
2.8 HADOOP架构及原理 | 第22-27页 |
2.8.1 HDFS介绍 | 第22-24页 |
2.8.1.1 命名节点 | 第23页 |
2.8.1.2 数据节点 | 第23-24页 |
2.8.2 MAPREDUCE介绍 | 第24-27页 |
2.8.2.1 思想来源 | 第25页 |
2.8.2.2 可靠分布 | 第25-26页 |
2.8.2.3 工作原理 | 第26-27页 |
2.9 HADOOP BITSTREAMING的使用 | 第27-29页 |
2.10 CUDA概述 | 第29-30页 |
2.11 本章小结 | 第30-31页 |
3 声学模型训练系统平台设计 | 第31-38页 |
3.1 系统平台架构 | 第31-32页 |
3.2 系统平台设计 | 第32-37页 |
3.2.1 在线语音存储 | 第32-36页 |
3.2.2 声学模型训练 | 第36-37页 |
3.3 本章小结 | 第37-38页 |
4 系统平台在线语音存储功能设计与实现 | 第38-47页 |
4.1 语音存储方案背景及概述 | 第38-39页 |
4.2 针对于海量小文件的HDFS处理策略 | 第39-41页 |
4.2.1 HAR FILES介绍 | 第40-41页 |
4.2.2 SEQUENCEFILE介绍 | 第41页 |
4.3 DBPROXY模块介绍 | 第41-45页 |
4.3.1 DBPROXY模块概述 | 第41-42页 |
4.3.2 DBPROXY工作方式 | 第42-44页 |
4.3.3 DBPROXY的日期切分方式 | 第44-45页 |
4.4 语音标注系统功能接口 | 第45-46页 |
4.5 本章小结 | 第46-47页 |
5 基于HADOOP的声学模型训练算法实现 | 第47-60页 |
5.1 基于深层神经网络的声学模型训练算法及原理 | 第47-49页 |
5.2 单机多卡声学模型训练方法 | 第49-51页 |
5.3 多机多卡声学模型训练方法 | 第51-52页 |
5.4 基于MAPREDUCE和GPU双重并行计算 | 第52-55页 |
5.5 模型训练实验及结果 | 第55-58页 |
5.5.1 实验配置 | 第55-56页 |
5.5.2 并行训练参数调试 | 第56-57页 |
5.5.3 实验结果 | 第57-58页 |
5.6 本章小结 | 第58-60页 |
6 结论 | 第60-62页 |
参考文献 | 第62-64页 |
作者简历 | 第64-66页 |
学位论文数据集 | 第66页 |