摘要 | 第5-7页 |
Abstract | 第7-8页 |
第一章 绪论 | 第9-13页 |
1.1 引言 | 第9页 |
1.2 相关工作 | 第9-11页 |
1.3 本文的主要工作 | 第11-13页 |
第二章 背景知识 | 第13-24页 |
2.1 PageRank简介 | 第13-14页 |
2.2 Hadoop简介 | 第14-24页 |
第三章 Hadoop上PageRank的常规计算方法 | 第24-31页 |
3.1 预处理 | 第25页 |
3.2 Map计算过程 | 第25-26页 |
3.3 MapReduce中间过程 | 第26-28页 |
3.3.1 分组 | 第26-27页 |
3.3.2 排序 | 第27页 |
3.3.3 网络传输 | 第27-28页 |
3.4 Reduce计算过程 | 第28-29页 |
3.5 判断收敛 | 第29-31页 |
第四章 Hadoop上PageRank的新计算方法 | 第31-41页 |
4.1 图划分方法 | 第32-37页 |
4.2 利用子图的局部性进行PageRank优化计算 | 第37-40页 |
4.2.1 预处理 | 第37-39页 |
4.2.2 GCPR的Map过程 | 第39-40页 |
4.2.3 GCPR的Reduce过程 | 第40页 |
4.3 GCPR性能的讨论 | 第40-41页 |
第五章 Cost Model | 第41-43页 |
第六章 实验 | 第43-53页 |
6.1 实验数据和相关设定 | 第43-44页 |
6.2 实验内容 | 第44-48页 |
6.2.1 函数调用次数比较 | 第44页 |
6.2.2 每个阶段产生的数据量对比 | 第44-45页 |
6.2.3 加速比 | 第45-46页 |
6.2.4 扩容比 | 第46-48页 |
6.3 稀疏图与原数据的对比分析 | 第48-53页 |
6.3.1 数据传输量分析 | 第49-50页 |
6.3.2 加速比 | 第50-51页 |
6.3.3 扩容比 | 第51-53页 |
第七章 结论和未来工作 | 第53-54页 |
参考文献 | 第54-55页 |
硕士研究生期间主要工作 | 第55-56页 |
致谢 | 第56-57页 |