GPGPU上图处理算法的实现与优化

摘要	第9-10页
ABSTRACT	第10-11页
第一章绪论	第12-16页
1.1 研究背景	第12-13页
1.2 研究现状	第13-14页
1.3 研究内容和主要贡献	第14-15页
1.4 本文组织结构	第15-16页
第二章相关知识	第16-25页
2.1 CUDA相关知识	第16-20页
2.1.1 CUDA模型	第16-20页
2.1.2 CUDA程序优化	第20页
2.2 图算法的两种实现框架	第20-23页
2.2.1 Data-driven	第20-22页
2.2.2 Topology-driven	第22-23页
2.3 CSR格式	第23-25页
第三章图着色	第25-45页
3.1 图着色	第25-27页
3.1.1 图着色应用	第25-26页
3.1.2 串行算法	第26-27页
3.2 并行图着色	第27-30页
3.2.1 GM算法	第27-29页
3.2.2 JP算法	第29-30页
3.3 GPU实现	第30-35页
3.3.1 现有GPU实现	第31-32页
3.3.2 算法设计与实现	第32-35页
3.4 针对GPU体系结构的优化	第35-36页
3.4.1 位向量	第35-36页
3.4.3 只读数据缓存	第36页
3.5 实验与性能分析	第36-44页
3.5.1 实验环境	第37页
3.5.2 位向量性能	第37-39页
3.5.3 只读数据缓存性能	第39-41页
3.5.4 最优实现	第41-42页
3.5.5 扩展性	第42-44页
3.6 总结	第44-45页
第四章强连通分量分解	第45-69页
4.1 强连通分量分解	第45-47页
4.1.1 强连通分量分解应用	第45-46页
4.1.2 串行算法	第46-47页
4.2 并行强连通分量分解	第47-53页
4.2.1 FB算法	第47-50页
4.2.2 Trimming	第50-51页
4.2.3 Coloring算法	第51-53页
4.3 GPU实现	第53-56页
4.3.1 现有GPU实现	第53-55页
4.3.2 算法设计与实现	第55-56页
4.4 针对GPU体系结构的优化	第56-59页
4.4.1 弱连通分量	第56-58页
4.4.2 负载平衡	第58-59页
4.5 实验与性能分析	第59-68页
4.5.1 实验环境	第59-60页
4.5.2 弱连通分量性能	第60-62页
4.5.3 负载平衡性能	第62-65页
4.5.4 最优实现	第65-66页
4.5.5 扩展性	第66-68页
4.6 总结	第68-69页
第五章总结与展望	第69-71页
5.1 总结	第69-70页
5.2 展望	第70-71页
致谢	第71-72页
参考文献	第72-75页
作者在学期间取得的学术成果	第75页