GPU上图处理并行框架的设计与实现
摘要 | 第1-6页 |
ABSTRACT | 第6-8页 |
目录 | 第8-11页 |
表格索引 | 第11-12页 |
插图索引 | 第12-13页 |
算法索引 | 第13-14页 |
第一章 绪论 | 第14-24页 |
·研究背景 | 第14-17页 |
·图算法中隐含的海量并行性 | 第14-16页 |
·GPU体系结构的诞生与发展 | 第16-17页 |
·GPU图计算面临的几个关键问题 | 第17-19页 |
·串行化与工作量之间的矛盾 | 第17-18页 |
·规则与不规则之间的矛盾 | 第18-19页 |
·GPU并行编程复杂度 | 第19页 |
·论文的研究目标与主要工作 | 第19-21页 |
·论文组织结构 | 第21-24页 |
第二章 相关研究工作 | 第24-30页 |
·并行图遍历相关研究工作 | 第24-28页 |
·基于PRAM的并行图遍历研究 | 第24-27页 |
·基于BSP的并行图遍历研究 | 第27-28页 |
·图处理并行框架与DSL | 第28-29页 |
·分布式存储结构上的图处理并行框架 | 第28页 |
·共享存储结构上的图处理并行框架 | 第28-29页 |
·小结 | 第29-30页 |
第三章 GPU图计算执行模型研究 | 第30-38页 |
·图数据特征分析 | 第30-32页 |
·数据集 | 第30页 |
·图数据的不规则性 | 第30-32页 |
·GPU图计算执行模型 | 第32-36页 |
·传统GPU图计算执行模型 | 第32页 |
·SIMD效率与拓扑结构之间的关系 | 第32-34页 |
·反映SIMD效率的性能指标 | 第34-36页 |
·小结 | 第36-38页 |
第四章 GPU图处理并行框架的设计与实现 | 第38-48页 |
·计算模型 | 第38-39页 |
·接口设计 | 第39-42页 |
·数据结构 | 第39页 |
·C++API | 第39-42页 |
·运行时支持 | 第42-47页 |
·数据存储 | 第42-43页 |
·主要函数实现 | 第43-45页 |
·优化技术一:基于线程组的映射 | 第45-46页 |
·优化技术二:降低串行化程度 | 第46-47页 |
·小结 | 第47-48页 |
第五章 GPU图计算框架的应用实例研究 | 第48-56页 |
·BFS图遍历 | 第48-50页 |
·算法描述和基于Olive的实现 | 第48-49页 |
·性能评测 | 第49-50页 |
·PageRank | 第50-52页 |
·算法描述和基于Olive的实现 | 第50-52页 |
·性能评测 | 第52页 |
·Bellman-Ford最短路径 | 第52-55页 |
·算法描述和基于Olive的实现 | 第52-54页 |
·性能评测 | 第54-55页 |
·小结 | 第55-56页 |
第六章 全文总结 | 第56-60页 |
·工作总结 | 第56-58页 |
·本文创新点 | 第58页 |
·未来工作展望 | 第58-60页 |
参考文献 | 第60-64页 |
致谢 | 第64-66页 |
在读期间发表的学术论文与取得的研究成果 | 第66-68页 |
在读期间参与的科研项目 | 第68页 |