CPU-GPU异构计算环境下的Cube CNN模型设计与应用研究

摘要	第3-4页
ABSTRACT	第4页
第一章引言	第8-18页
第一节研究背景	第8-11页
1.1.1 高光谱图像分类简介	第8-9页
1.1.2 深度学习简介	第9页
1.1.3 异构计算简介	第9-11页
第二节国内外研究现状	第11-15页
1.2.1 基于深度学习方法的高光谱图像分类	第11-12页
1.2.2 深度学习并行加速方法	第12-14页
1.2.3 GPU通用并行深度学习平台简介	第14-15页
第三节本文研究内容及意义	第15-16页
第四节本文组织结构	第16-18页
第二章高光谱图像分类模型设计	第18-30页
第一节高光谱图像数据结构	第18-19页
第二节 CNN模型关键技术	第19-21页
第三节 CUBECNN分类模型设计	第21-25页
2.3.1 空谱特征融合	第21页
2.3.2 近邻像素策略	第21-22页
2.3.3 Cube卷积操作	第22-24页
2.3.4 CubeCNN分类模型结构	第24-25页
第四节 CUBECNN分类模型训练	第25-29页
2.4.1 数据预处理	第25页
2.4.2 前向传播	第25-27页
2.4.3 反向传播	第27-29页
第五节本章小结	第29-30页
第三章 CUBECNN模型训练的GPU并行化设计	第30-43页
第一节 GPU体系结构	第30-33页
3.1.1 线程架构和内存结构	第30-32页
3.1.2 流多处理器结构	第32-33页
第二节基于GPU的CUBECNN并行性分析	第33-35页
3.2.1 近邻特征提取	第34-35页
3.2.2 CubeCNN训练算法分析	第35页
第三节 CUBECNN模型训练向GPU端的移植	第35-42页
3.3.1 二维卷积并行化	第36-37页
3.3.2 映射机制	第37-41页
3.3.3 GPU硬件调用设计	第41-42页
第四节本章小结	第42-43页
第四章 CUBECNN模型的GPU并行化实现	第43-51页
第一节实现流程	第43-44页
第二节数据类型定义	第44-45页
第三节数据预处理过程	第45-46页
第四节同步机制	第46-50页
4.4.1 参数更新算法	第47-48页
4.4.2 Kernel之间的同步	第48-49页
4.4.3 线程间的同步	第49-50页
第五节本章小结	第50-51页
第五章实验结果及分析	第51-63页
第一节概述	第51-52页
5.1.1 实验平台	第51页
5.1.2 数据集	第51-52页
5.1.3 评价指标	第52页
第二节数据预处理结果分析	第52-54页
第三节模型训练结果分析	第54-57页
第四节资源利用分析	第57-59页
第五节 GCN扩展性分析	第59-61页
第六节单精度CUDAKERNEL实验	第61-62页
第七节本章小结	第62-63页
第六章总结与展望	第63-64页
参考文献	第64-68页
致谢	第68-69页
个人简历、学术论文与研究成果	第69页