深度学习模型的高效训练算法研究

摘要	第1-7页
ABSTRACT	第7-17页
主要符号对照表	第17-19页
第一章绪论	第19-39页
·研究背景及意义	第19-20页
·深度学习研究现状	第20-21页
·深度神经网络简介	第21-24页
·网络结构	第21-22页
·后向传播算法	第22-24页
·递归神经网络简介	第24-28页
·网络结构	第24-26页
·时域后向传播算法	第26-28页
·长短时记忆元递归神经网络	第28-32页
·LSTM结构	第28-30页
·后向传播[2]	第30-32页
·深度学习模型在大词汇量连续语音识别中的应用	第32-33页
·序列标注的连接时序分类训练[2]	第33-37页
·相关概念	第33-34页
·前后向算法	第34-36页
·模型训练	第36-37页
·解码算法	第37页
·本文主要工作	第37-38页
·本文结构安排	第38-39页
第二章基于样本分离边距的最小分类误差准则在深度神经网络训练中的应用	第39-53页
·引言	第39页
·ReLU-DNN在模式分类问题中的应用	第39-42页
·交叉熵准则	第42-43页
·最小分类误差准则	第43-45页
·基于样本分离边距的最小分类误差准则	第45-48页
·实验结果	第48-51页
·实验设置	第48-49页
·手写识别实验结果	第49-50页
·语音识别实验结果	第50-51页
·本章小结	第51-53页
第三章长短时记忆元递归神经网络的一种快速训练算法	第53-73页
·引言	第53-55页
·递归神经网络训练算法回顾	第55-59页
·BPTT(∞)算法	第55-56页
·BPTT(h)算法	第56页
·BPTT(h,h')算法	第56-57页
·Epoch-wise BPTT算法	第57-59页
·RTRL算法	第59页
·基于上下文敏感区块的BPTT算法	第59-62页
·上下文敏感区块定义	第59-60页
·训练算法	第60-61页
·解码算法	第61-62页
·其他研究组的相关后续工作	第62页
·实验结果	第62-71页
·手写识别任务	第63-66页
·大词汇量连续语音识别任务	第66-71页
·本章小结	第71-73页
第四章深度学习模型的数据并行训练算法	第73-107页
·引言	第73-75页
·相关工作	第75-77页
·异步随机梯度下降算法	第75页
·模型平均算法	第75-76页
·1-bit SGD[3]	第76-77页
·数据并行增量块训练框架	第77-78页
·基于ADMM的IBT算法	第78-83页
·ADMM算法的一般形式	第79-80页
·全局一致问题的ADMM求解算法	第80-81页
·基于ADMM的深度学习模型训练IBT算法	第81-83页
·基于数据并行优化和BMUF的IBT算法	第83-90页
·MA算法与SGD算法比较	第84-85页
·逐区块模型更新滤波技术	第85-88页
·BMUF算法技术原理	第88-89页
·BMUF算法训练参数设置准则	第89-90页
·训练系统实现	第90-91页
·实验平台	第90-91页
·实现细节	第91页
·实验结果	第91-105页
·实验数据集	第91-92页
·基于ADMM的分布式IBT算法实验结果	第92-96页
·基于数据并行优化和BMUF的IBT算法	第96-105页
·本章小结	第105-107页
第五章总结和展望	第107-111页
·本文研究重点回顾	第107-108页
·研究工作展望	第108-111页
参考文献	第111-121页
致谢	第121-123页
在读期间发表的学术论文与取得的研究成果	第123页