CPU-GPU异构计算环境下的Cube CNN模型设计与应用研究
摘要 | 第3-4页 |
ABSTRACT | 第4页 |
第一章 引言 | 第8-18页 |
第一节 研究背景 | 第8-11页 |
1.1.1 高光谱图像分类简介 | 第8-9页 |
1.1.2 深度学习简介 | 第9页 |
1.1.3 异构计算简介 | 第9-11页 |
第二节 国内外研究现状 | 第11-15页 |
1.2.1 基于深度学习方法的高光谱图像分类 | 第11-12页 |
1.2.2 深度学习并行加速方法 | 第12-14页 |
1.2.3 GPU通用并行深度学习平台简介 | 第14-15页 |
第三节 本文研究内容及意义 | 第15-16页 |
第四节 本文组织结构 | 第16-18页 |
第二章 高光谱图像分类模型设计 | 第18-30页 |
第一节 高光谱图像数据结构 | 第18-19页 |
第二节 CNN模型关键技术 | 第19-21页 |
第三节 CUBECNN分类模型设计 | 第21-25页 |
2.3.1 空谱特征融合 | 第21页 |
2.3.2 近邻像素策略 | 第21-22页 |
2.3.3 Cube卷积操作 | 第22-24页 |
2.3.4 CubeCNN分类模型结构 | 第24-25页 |
第四节 CUBECNN分类模型训练 | 第25-29页 |
2.4.1 数据预处理 | 第25页 |
2.4.2 前向传播 | 第25-27页 |
2.4.3 反向传播 | 第27-29页 |
第五节 本章小结 | 第29-30页 |
第三章 CUBECNN模型训练的GPU并行化设计 | 第30-43页 |
第一节 GPU体系结构 | 第30-33页 |
3.1.1 线程架构和内存结构 | 第30-32页 |
3.1.2 流多处理器结构 | 第32-33页 |
第二节 基于GPU的CUBECNN并行性分析 | 第33-35页 |
3.2.1 近邻特征提取 | 第34-35页 |
3.2.2 CubeCNN训练算法分析 | 第35页 |
第三节 CUBECNN模型训练向GPU端的移植 | 第35-42页 |
3.3.1 二维卷积并行化 | 第36-37页 |
3.3.2 映射机制 | 第37-41页 |
3.3.3 GPU硬件调用设计 | 第41-42页 |
第四节 本章小结 | 第42-43页 |
第四章 CUBECNN模型的GPU并行化实现 | 第43-51页 |
第一节 实现流程 | 第43-44页 |
第二节 数据类型定义 | 第44-45页 |
第三节 数据预处理过程 | 第45-46页 |
第四节 同步机制 | 第46-50页 |
4.4.1 参数更新算法 | 第47-48页 |
4.4.2 Kernel之间的同步 | 第48-49页 |
4.4.3 线程间的同步 | 第49-50页 |
第五节 本章小结 | 第50-51页 |
第五章 实验结果及分析 | 第51-63页 |
第一节 概述 | 第51-52页 |
5.1.1 实验平台 | 第51页 |
5.1.2 数据集 | 第51-52页 |
5.1.3 评价指标 | 第52页 |
第二节 数据预处理结果分析 | 第52-54页 |
第三节 模型训练结果分析 | 第54-57页 |
第四节 资源利用分析 | 第57-59页 |
第五节 GCN扩展性分析 | 第59-61页 |
第六节 单精度CUDAKERNEL实验 | 第61-62页 |
第七节 本章小结 | 第62-63页 |
第六章 总结与展望 | 第63-64页 |
参考文献 | 第64-68页 |
致谢 | 第68-69页 |
个人简历、学术论文与研究成果 | 第69页 |