摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
符号对照表 | 第12-13页 |
缩略语对照表 | 第13-16页 |
第一章 绪论 | 第16-24页 |
1.1 研究背景及意义 | 第16-17页 |
1.2 研究现状 | 第17-21页 |
1.2.1 重量级增量计算框架 | 第17-18页 |
1.2.2 轻量级增量计算框架 | 第18-21页 |
1.3 研究内容 | 第21页 |
1.4 本文章节安排 | 第21-22页 |
1.5 本章小结 | 第22-24页 |
第二章 分布式增量计算简介 | 第24-36页 |
2.1 云计算发展过程的简介 | 第24-27页 |
2.2 云计算基础平台Hadoop简介 | 第27-29页 |
2.3 基于Hadoop的增量计算框架简介 | 第29-33页 |
2.3.1 增量计算框架Incoop简介 | 第29-31页 |
2.3.2 增量计算框架HadUP简介 | 第31-33页 |
2.4 本章小结 | 第33-36页 |
第三章 基于Hadoop的增量式数据处理算法的设计 | 第36-56页 |
3.1 总体设计综述 | 第36-38页 |
3.2 通用的初始计算流程设计 | 第38-46页 |
3.2.1 数据划分预处理的设计 | 第39-43页 |
3.2.2 基于MapReduce的增量计算框架设计 | 第43-46页 |
3.3 迭代的后续计算流程设计 | 第46-54页 |
3.3.1 结果重用机制 | 第46-49页 |
3.3.2 细粒度划分算法 | 第49-51页 |
3.3.3 差集获取算法 | 第51-54页 |
3.4 本章小结 | 第54-56页 |
第四章 基于Hadoop的增量式数据处理算法的实现 | 第56-74页 |
4.1 通用的初始计算流程实现 | 第56-64页 |
4.1.1 远程任务提交的实现 | 第56-58页 |
4.1.2 数据划分预处理的实现 | 第58-61页 |
4.1.3 基于Mapreduce分布式计算的实现 | 第61-64页 |
4.2 迭代的后续计算流程实现 | 第64-73页 |
4.2.1 结果重用机制的实现 | 第64-68页 |
4.2.2 细粒度划分的实现 | 第68-70页 |
4.2.3 差集计算的实现 | 第70-73页 |
4.3 本章小结 | 第73-74页 |
第五章 实验结果及分析 | 第74-90页 |
5.1 测试分类及分析 | 第74-78页 |
5.1.1 测试分类 | 第74-75页 |
5.1.2 测试分析 | 第75-78页 |
5.2 系统优化 | 第78-82页 |
5.2.1 数据加载优化 | 第78-79页 |
5.2.2 消除原子数据的截断问题 | 第79-80页 |
5.2.3 窗口滑动算法优化 | 第80-82页 |
5.3 系统测试 | 第82-88页 |
5.3.1 简单追加场景 | 第82-83页 |
5.3.2 复杂追加场景 | 第83页 |
5.3.3 复杂的多类型修改场景 | 第83-86页 |
5.3.4 不同分片大小的场景 | 第86-87页 |
5.3.5 实际数据测试 | 第87-88页 |
5.4 本章小结 | 第88-90页 |
第六章 总结与展望 | 第90-92页 |
6.1 总结 | 第90页 |
6.2 展望 | 第90-92页 |
参考文献 | 第92-98页 |
致谢 | 第98-100页 |
作者简介 | 第100-101页 |