摘要 | 第4-6页 |
abstract | 第6-7页 |
第1章 绪论 | 第11-21页 |
1.1 论文研究背景及意义 | 第11-13页 |
1.2 国内外研究现状 | 第13-16页 |
1.3 论文主要研究内容与结构安排 | 第16-21页 |
第2章 大数据处理系统相关关键技术研究 | 第21-31页 |
2.1 Hadoop/MapReduce大数据处理平台研究 | 第21-26页 |
2.1.1 Hadoop架构研究 | 第21页 |
2.1.2 MapReduce数据处理模型 | 第21-23页 |
2.1.3 Hadoop系统实现 | 第23-26页 |
2.2 基于MapReduce的数据挖掘算法研究 | 第26-29页 |
2.3 本章小结 | 第29-31页 |
第3章 基于MapReduce的局部迭代模型及其实现 | 第31-51页 |
3.1 针对MapReduce数据处理模型分析 | 第31-35页 |
3.1.1 Hadoop运算代价模型 | 第31-34页 |
3.1.2 优化策略分析 | 第34-35页 |
3.2 迭代类数据挖掘算法的局部迭代性分析 | 第35-37页 |
3.3 局部迭代的MapReduce数据处理模型及其适用性分析 | 第37-41页 |
3.3.1 PI-MR模型索引功能以及缓存功能的实现 | 第38页 |
3.3.2 PI-MR模型提升平台对于局部迭代计算良好支持的实现 | 第38-39页 |
3.3.3 PI-MR模型合理划分子图的实现 | 第39-40页 |
3.3.4 PI-MR模型适用性分析 | 第40-41页 |
3.4 PI-MR模型的实现 | 第41-48页 |
3.4.1 修改Hadoop平台内核实现PI-MR模型 | 第41-46页 |
3.4.2 HBase数据库应用于PI-MR模型上的实现 | 第46-48页 |
3.5 PI-MR模型与其他数据处理模型的比较 | 第48-49页 |
3.6 本章小结 | 第49-51页 |
第4章 PageRank算法在PI-MR模型上的实现 | 第51-61页 |
4.1 PageRank算法的局部迭代性分析 | 第51页 |
4.2 PI-PageRank算法的具体步骤 | 第51-57页 |
4.2.1 对于图数据的子图划分 | 第52-54页 |
4.2.2 Map函数及其缓存更新 | 第54-55页 |
4.2.3 Reduce函数及其数据更新 | 第55-56页 |
4.2.4 权威值收敛判定 | 第56-57页 |
4.3 PI-PageRank算法的代价分析 | 第57-58页 |
4.4 PI-PageRank算法的具体实现 | 第58-59页 |
4.5 本章小结 | 第59-61页 |
第5章 仿真实验与分析 | 第61-71页 |
5.1 PI-PageRank算法所用实验数据集与实验环境 | 第61页 |
5.2 PI-PageRank算法性能分析 | 第61-63页 |
5.3 运行于PI-MR模型上的PI-PageRank算法的实验性能分析 | 第63-68页 |
5.4 本章小结 | 第68-71页 |
第6章 总结与展望 | 第71-73页 |
6.1 全文工作总结 | 第71-72页 |
6.2 对未来工作展望 | 第72-73页 |
参考文献 | 第73-79页 |
作者简介 | 第79-80页 |
致谢 | 第80页 |