cuda-convnet深层卷积神经网络算法的一种速度优化

摘要	第4-5页
Abstract	第5页
第1章绪论	第8-14页
1.1 研究背景与意义	第8-10页
1.2 国内外研究现状	第10-11页
1.3 本文的研究内容	第11页
1.4 本文的组织结构	第11-12页
1.5 本章小结	第12-14页
第2章深层卷积神经网络	第14-26页
2.1 深层卷积神经网络概述	第14-15页
2.2 深层卷积神经网络模型	第15-25页
2.2.1 神经网络模型	第15-18页
2.2.2 神经网络的反向传播算法	第18-21页
2.2.3 深层卷积神经网络结构	第21-25页
2.3 深层卷积神经网络存在的相关问题	第25页
2.4 本章小结	第25-26页
第3章 CUDA框架	第26-34页
3.1 CUDA技术概述	第26-28页
3.2 CPU与GPU架构	第28-29页
3.3 CUDA的线程层次结构	第29-32页
3.4 本章小结	第32-34页
第4章深层卷积神经网络的并行化	第34-50页
4.1 卷积	第34-36页
4.2 卷积操作的并行原理	第36-37页
4.3 各线程完成卷积运算的过程	第37-43页
4.3.1 图像和卷积核的分配方式	第38-39页
4.3.2 卷积所需数据存入共享内存的过程	第39-42页
4.3.3 特征图与卷积核的存储方式	第42-43页
4.4 cuda-convnet算法的卷积操作	第43-44页
4.5 本文的特征图与像素并行算法的提出	第44-48页
4.6 本章小结	第48-50页
第5章实验结果与分析	第50-54页
5.1 不同算法的卷积操作的分析	第50-51页
5.2 实验结果与分析	第51-52页
5.3 本章小结	第52-54页
结论	第54-56页
参考文献	第56-60页
攻读硕士学位期间所发表的学术论文	第60-62页
致谢	第62页