基于GPU的深度学习算法并行化研究

摘要	第5-6页
Abstract	第6页
第一章绪论	第9-14页
1.1 研究背景及意义	第9-10页
1.2 国内外研究现状	第10-12页
1.2.1 深度学习的研究现状	第10-11页
1.2.2 硬件加速的研究现状	第11-12页
1.2.3 GPU并行计算的研究现状	第12页
1.3 论文研究内容	第12-13页
1.4 论文组织结构	第13-14页
第二章常见的深度学习网络结构	第14-25页
2.1 人工神经网络	第14-18页
2.1.1 概述	第14页
2.1.2 神经网络结构	第14-17页
2.1.3 反向传播算法	第17-18页
2.2 卷积神经网络	第18-24页
2.2.1 稀疏连接和权值共享	第18-20页
2.2.2 卷积神经网络结构	第20-22页
2.2.3 卷积神经网络的反向传播	第22-24页
2.3 本章小结	第24-25页
第三章 GPU通用计算和CUDA技术	第25-32页
3.1 图形处理器GPU	第25-27页
3.1.1 GPU简介	第25页
3.1.2 GPU通用计算	第25-26页
3.1.3 GPU与CPU	第26-27页
3.2 CUDA技术简介	第27-31页
3.2.1 CUDA线程结构	第27-28页
3.2.2 CUDA存储结构	第28-30页
3.2.3 CUDA编程模型	第30-31页
3.3 本章小结	第31-32页
第四章基于GPU的深度学习算法并行化	第32-43页
4.1 卷积神经网络并行化的关键技术	第32-35页
4.1.1 卷积展开成矩阵乘法	第32-34页
4.1.2 激活函数ReLU	第34-35页
4.2 基于GPU的卷积神经网络设计与实现	第35-39页
4.2.1 卷积层的实现	第35-37页
4.2.2 采样层的实现	第37-38页
4.2.3 激活层与全连接层的实现	第38-39页
4.3 网络模型初始化和训练过程	第39-42页
4.3.1 网络结构搭建	第39页
4.3.2 数据预处理和参数初始化	第39-40页
4.3.3 网络训练过程	第40-42页
4.4 本章小结	第42-43页
第五章性能测试与结果分析	第43-55页
5.1 实验环境与测试方法设计	第43-44页
5.2 LeNet-5上的实验	第44-47页
5.2.1 LeNet-5网络模型	第44页
5.2.2 MNIST数据集	第44-45页
5.2.3 实验结果分析	第45-47页
5.3 CIFAR-10网络模型的实验	第47-49页
5.3.1 CIFAR-10网络模型	第47页
5.3.2 CIFAR-10数据集	第47-48页
5.3.3 实验结果分析	第48-49页
5.4 AlexNet网络模型的实验	第49-54页
5.4.1 AlexNet网络模型	第49-50页
5.4.2 ImageNet数据集简介	第50-51页
5.4.3 实验结果分析	第51-54页
5.5 本章小结	第54-55页
第六章总结与展望	第55-56页
6.1 论文总结	第55页
6.2 未来工作展望	第55-56页
致谢	第56-57页
参考文献	第57-61页
攻读硕士期间取得的科研成果	第61页