基于深度神经网络的语音信号特征学习研究
摘要 | 第3-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第9-13页 |
1.1 语音及音素识别的研究意义 | 第9-10页 |
1.2 国内外研究现状 | 第10-11页 |
1.3 研究内容与论文框架 | 第11-13页 |
第2章 语音识别与深度学习基础知识及算法 | 第13-29页 |
2.1 语音信号的预处理 | 第13-15页 |
2.1.2 语音信号的加窗处理 | 第14-15页 |
2.2 语音信号的特征提取 | 第15-18页 |
2.3 HMM声学建模 | 第18-20页 |
2.4 深度学习理论基础 | 第20-22页 |
2.4.1 深度学习的基本思想 | 第20-21页 |
2.4.2 深度学习的训练方法 | 第21-22页 |
2.5 深度学习的常用模型之“自编码器” | 第22-24页 |
2.6 受限玻尔兹曼机 | 第24-27页 |
2.6.1 RBM参数训练过程 | 第26-27页 |
2.7 本章小结 | 第27-29页 |
第3章 串联深度神经网络与特征学习 | 第29-37页 |
3.1 串联系统 | 第29-30页 |
3.2 串联深度神经网络模型设计 | 第30-31页 |
3.3 基于深度神经网络DNN的深度瓶颈特征提取 | 第31-34页 |
3.4 第二级深度自编码器与深度特征 | 第34-36页 |
3.4.1 深度自编码器的训练及特征提取 | 第35-36页 |
3.5 本章小结 | 第36-37页 |
第4章 仿真及结果分析 | 第37-49页 |
4.1 kaldi语音识别平台简介 | 第37-38页 |
4.2 TIMIT语音数据集介绍 | 第38-39页 |
4.3 原始特征提取及优化过程 | 第39-41页 |
4.4 基于DAE的语音深度特征提取 | 第41-44页 |
4.4.1 DAE网络框架设计及仿真结果分析 | 第42-44页 |
4.5 串联深度神经网络的特征学习与表示分析 | 第44-48页 |
4.6 本章小结 | 第48-49页 |
第5章 总结与展望 | 第49-51页 |
5.1 研究工作总结 | 第49-50页 |
5.2 对本文研究工作的展望 | 第50-51页 |
参考文献 | 第51-55页 |
致谢 | 第55-57页 |
攻读学位期间的研究成果 | 第57页 |