基于hadoop的增量式数据处理算法的研究与实现

摘要	第5-7页
ABSTRACT	第7-8页
符号对照表	第12-13页
缩略语对照表	第13-16页
第一章绪论	第16-24页
1.1 研究背景及意义	第16-17页
1.2 研究现状	第17-21页
1.2.1 重量级增量计算框架	第17-18页
1.2.2 轻量级增量计算框架	第18-21页
1.3 研究内容	第21页
1.4 本文章节安排	第21-22页
1.5 本章小结	第22-24页
第二章分布式增量计算简介	第24-36页
2.1 云计算发展过程的简介	第24-27页
2.2 云计算基础平台Hadoop简介	第27-29页
2.3 基于Hadoop的增量计算框架简介	第29-33页
2.3.1 增量计算框架Incoop简介	第29-31页
2.3.2 增量计算框架HadUP简介	第31-33页
2.4 本章小结	第33-36页
第三章基于Hadoop的增量式数据处理算法的设计	第36-56页
3.1 总体设计综述	第36-38页
3.2 通用的初始计算流程设计	第38-46页
3.2.1 数据划分预处理的设计	第39-43页
3.2.2 基于MapReduce的增量计算框架设计	第43-46页
3.3 迭代的后续计算流程设计	第46-54页
3.3.1 结果重用机制	第46-49页
3.3.2 细粒度划分算法	第49-51页
3.3.3 差集获取算法	第51-54页
3.4 本章小结	第54-56页
第四章基于Hadoop的增量式数据处理算法的实现	第56-74页
4.1 通用的初始计算流程实现	第56-64页
4.1.1 远程任务提交的实现	第56-58页
4.1.2 数据划分预处理的实现	第58-61页
4.1.3 基于Mapreduce分布式计算的实现	第61-64页
4.2 迭代的后续计算流程实现	第64-73页
4.2.1 结果重用机制的实现	第64-68页
4.2.2 细粒度划分的实现	第68-70页
4.2.3 差集计算的实现	第70-73页
4.3 本章小结	第73-74页
第五章实验结果及分析	第74-90页
5.1 测试分类及分析	第74-78页
5.1.1 测试分类	第74-75页
5.1.2 测试分析	第75-78页
5.2 系统优化	第78-82页
5.2.1 数据加载优化	第78-79页
5.2.2 消除原子数据的截断问题	第79-80页
5.2.3 窗口滑动算法优化	第80-82页
5.3 系统测试	第82-88页
5.3.1 简单追加场景	第82-83页
5.3.2 复杂追加场景	第83页
5.3.3 复杂的多类型修改场景	第83-86页
5.3.4 不同分片大小的场景	第86-87页
5.3.5 实际数据测试	第87-88页
5.4 本章小结	第88-90页
第六章总结与展望	第90-92页
6.1 总结	第90页
6.2 展望	第90-92页
参考文献	第92-98页
致谢	第98-100页
作者简介	第100-101页