基于复合双向循环网络特定工况的语音识别研究

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第13-18页
1.1 课题研究背景及意义	第13-14页
1.1.1 神经网络发展概述及优势	第13-14页
1.1.2 循环网络(RNN)对语音识别的影响	第14页
1.2 基于LSTM网络的语音识别国内外研究现状	第14-17页
1.2.1 模型结构	第15页
1.2.2 LSTM网络架构	第15-16页
1.2.3 LSTM目标函数	第16-17页
1.3 本论文的课题来源及研究内容	第17页
1.3.1 本论文的课题来源	第17页
1.3.2 本论文的研究内容	第17页
1.4 本章小结	第17-18页
第二章语音识别理论	第18-25页
2.1 语音识别原理	第18-20页
2.2 语音识别过程	第20-22页
2.3 声学特征的提取	第22-23页
2.3.1 Mel频率倒谱系数	第22页
2.3.2 Mel频率倒谱系数(MFCC)参数的提取步骤	第22-23页
2.4 本章小结	第23-25页
第3章实验平台搭建与深度双向LSTM网络测试	第25-36页
3.1 语音识别模型概述	第25-27页
3.2 实验平台搭建	第27-31页
3.2.1 实验硬件系统选配	第27-28页
3.2.2 实验软件系统调试	第28-31页
3.3 测试步骤及结果对比	第31-35页
3.3.1 不同类型模型效果对比	第31-34页
3.3.2 单向与双向LSTM结构识别效果对比	第34-35页
3.4 本章小结	第35-36页
第四章工况噪声环境下的语音识别	第36-49页
4.1 降噪原理	第36-37页
4.2 工况环境下噪声特点的分析	第37-46页
4.2.1 冲压车间噪声	第38-40页
4.2.2 机加工车间噪声	第40-42页
4.2.3 焊接车间噪声	第42-43页
4.2.4 喷漆车间噪声	第43-45页
4.2.5 检测车间噪声	第45页
4.2.6 食堂噪声	第45-46页
4.3 语音资料预处理	第46页
4.4 噪声环境下的语音实验	第46-48页
4.5 本章小结	第48-49页
第五章模型网络结构与目标函数	第49-70页
5.1 标准LSTM结构分析	第49-51页
5.2 复合双向LSTM网络结构分析	第51-56页
5.2.1 双向LSTM网络结构分析	第51-52页
5.2.2 复合双向LSTM网络结构分析	第52-53页
5.2.3 模型结构描述	第53-56页
5.3 目标函数推导	第56-61页
5.3.1 一种输出与目标对齐的方法	第57-58页
5.3.2 前端与后端变量定义	第58-60页
5.3.3 目标函数推导	第60-61页
5.4 模型测试准备	第61-62页
5.4.1 语音资料概述及预处理	第61-62页
5.4.2 测试平台、模型参数与训练设定	第62页
5.5 工况环境下语音识别实验	第62-68页
5.5.1 前端变量与后端变量验证	第65-68页
5.6 本章小结	第68-70页
第六章总结与展望	第70-72页
6.1 总结	第70页
6.2 展望	第70-72页
参考文献	第72-77页
致谢	第77页