面向性能异构的卷积神经网络并行优化研究

详细摘要	第2-8页
摘要	第8-10页
ABSTRACT	第10-11页
第一章绪论	第14-22页
1.1 本文研究背景及其意义	第14-15页
1.2 课题相关领域发展情况	第15-20页
1.2.1 硬件并行化加速	第15-16页
1.2.2 训练方法加速	第16-20页
1.2.3 深度学习框架并行化	第20页
1.3 论文的主要工作	第20-21页
1.4 本文的组织与结构	第21-22页
第二章相关理论知识	第22-30页
2.1 人工神经网络	第22-25页
2.1.1 发展概述	第22-23页
2.1.2 神经元与单层感知器	第23-24页
2.1.3 多层感知器与神经网络	第24-25页
2.1.4 反向传播算法和反向传播神经网络	第25页
2.2 卷积神经网络	第25-29页
2.2.1 卷积神经网络结构	第25-27页
2.2.2 卷积神经网络下的反向传播算法	第27-29页
2.3 本章小结	第29-30页
第三章面向大规模卷积神经网络并行方法分析	第30-45页
3.1 问题描述与分析	第30-32页
3.2 问题解决思路	第32页
3.3 面向大规模卷积神经网络并行方法分析	第32-43页
3.3.1 面向大规模卷积神经网络并行计算模型	第33-38页
3.3.2 大规模卷积神经网络训练性能优化方法	第38-41页
3.3.3 资源动态管理策略	第41-43页
3.4 本章小结	第43-45页
第四章面向性能异构的卷积神经网络通信层优化策略	第45-57页
4.1 问题描述与分析	第45-46页
4.2 延迟同步并行策略	第46-48页
4.3 通信拓扑结构和参数存储方式优化	第48-49页
4.4 延迟同步并行策略实现	第49-51页
4.5 延迟同步并行策略的实验及分析	第51-56页
4.5.1 策略有效性及其性能实验	第53-54页
4.5.2 策略的可扩展性实验	第54-55页
4.5.3 最大间隔对模型训练的影响实验	第55-56页
4.6 本章小结	第56-57页
第五章总结与展望	第57-59页
5.1 本文工作总结	第57-58页
5.2 未来工作及展望	第58-59页
致谢	第59-61页
参考文献	第61-66页
附录	第66页