GPU上图处理并行框架的设计与实现
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-8页 |
| 目录 | 第8-11页 |
| 表格索引 | 第11-12页 |
| 插图索引 | 第12-13页 |
| 算法索引 | 第13-14页 |
| 第一章 绪论 | 第14-24页 |
| ·研究背景 | 第14-17页 |
| ·图算法中隐含的海量并行性 | 第14-16页 |
| ·GPU体系结构的诞生与发展 | 第16-17页 |
| ·GPU图计算面临的几个关键问题 | 第17-19页 |
| ·串行化与工作量之间的矛盾 | 第17-18页 |
| ·规则与不规则之间的矛盾 | 第18-19页 |
| ·GPU并行编程复杂度 | 第19页 |
| ·论文的研究目标与主要工作 | 第19-21页 |
| ·论文组织结构 | 第21-24页 |
| 第二章 相关研究工作 | 第24-30页 |
| ·并行图遍历相关研究工作 | 第24-28页 |
| ·基于PRAM的并行图遍历研究 | 第24-27页 |
| ·基于BSP的并行图遍历研究 | 第27-28页 |
| ·图处理并行框架与DSL | 第28-29页 |
| ·分布式存储结构上的图处理并行框架 | 第28页 |
| ·共享存储结构上的图处理并行框架 | 第28-29页 |
| ·小结 | 第29-30页 |
| 第三章 GPU图计算执行模型研究 | 第30-38页 |
| ·图数据特征分析 | 第30-32页 |
| ·数据集 | 第30页 |
| ·图数据的不规则性 | 第30-32页 |
| ·GPU图计算执行模型 | 第32-36页 |
| ·传统GPU图计算执行模型 | 第32页 |
| ·SIMD效率与拓扑结构之间的关系 | 第32-34页 |
| ·反映SIMD效率的性能指标 | 第34-36页 |
| ·小结 | 第36-38页 |
| 第四章 GPU图处理并行框架的设计与实现 | 第38-48页 |
| ·计算模型 | 第38-39页 |
| ·接口设计 | 第39-42页 |
| ·数据结构 | 第39页 |
| ·C++API | 第39-42页 |
| ·运行时支持 | 第42-47页 |
| ·数据存储 | 第42-43页 |
| ·主要函数实现 | 第43-45页 |
| ·优化技术一:基于线程组的映射 | 第45-46页 |
| ·优化技术二:降低串行化程度 | 第46-47页 |
| ·小结 | 第47-48页 |
| 第五章 GPU图计算框架的应用实例研究 | 第48-56页 |
| ·BFS图遍历 | 第48-50页 |
| ·算法描述和基于Olive的实现 | 第48-49页 |
| ·性能评测 | 第49-50页 |
| ·PageRank | 第50-52页 |
| ·算法描述和基于Olive的实现 | 第50-52页 |
| ·性能评测 | 第52页 |
| ·Bellman-Ford最短路径 | 第52-55页 |
| ·算法描述和基于Olive的实现 | 第52-54页 |
| ·性能评测 | 第54-55页 |
| ·小结 | 第55-56页 |
| 第六章 全文总结 | 第56-60页 |
| ·工作总结 | 第56-58页 |
| ·本文创新点 | 第58页 |
| ·未来工作展望 | 第58-60页 |
| 参考文献 | 第60-64页 |
| 致谢 | 第64-66页 |
| 在读期间发表的学术论文与取得的研究成果 | 第66-68页 |
| 在读期间参与的科研项目 | 第68页 |