摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
缩略词表 | 第15-16页 |
第一章 绪论 | 第16-20页 |
1.1 研究背景及意义 | 第16-18页 |
1.2 研究内容与贡献 | 第18页 |
1.3 论文结构及内容安排 | 第18-20页 |
第二章 分布式实时增量计算相关研究 | 第20-39页 |
2.1 MapReduce相关研究介绍 | 第21-24页 |
2.1.1 MapReduce编程模型 | 第21-22页 |
2.1.2 系统架构 | 第22-24页 |
2.1.3 计算特点及不足 | 第24页 |
2.2 Storm | 第24-34页 |
2.2.1 系统架构 | 第25-28页 |
2.2.2 送达保证 | 第28-30页 |
2.2.3 Storm Trident | 第30-33页 |
2.2.4 实时增量框架设计理念 | 第33-34页 |
2.3 增量计算 | 第34-35页 |
2.3.1 Incoop | 第34-35页 |
2.3.2 DryadInc | 第35页 |
2.4 其它分布式技术 | 第35-38页 |
2.4.1 Zoo Keeper | 第35-36页 |
2.4.2 HBase | 第36-38页 |
2.5 本章小结 | 第38-39页 |
第三章 基于Storm的分布式实时增量计算框架研究与设计 | 第39-62页 |
3.1 功能设计 | 第39-40页 |
3.1.1 总体功能 | 第39-40页 |
3.1.2 基础架构 | 第40页 |
3.2 MapReduceMerge编程模型 | 第40-46页 |
3.2.1“包工头-监工-工人”模式 | 第43-44页 |
3.2.2 Topology设计 | 第44-46页 |
3.3 数据传递 | 第46-51页 |
3.3.1 批计算模式 | 第46-49页 |
3.3.2 数据倾斜 | 第49-51页 |
3.4 容错机制 | 第51-57页 |
3.4.1 容错模式 | 第52-53页 |
3.4.2 协调数据 | 第53-54页 |
3.4.3 增量结果 | 第54-57页 |
3.5 增量计算 | 第57-61页 |
3.5.1 偏序与全序 | 第57页 |
3.5.2 内存快照 | 第57-59页 |
3.5.3 Checkpoint的全序 | 第59页 |
3.5.4 Rollback机制 | 第59-61页 |
3.6 本章小结 | 第61-62页 |
第四章 基于Storm的分布式实时增量计算框架实现 | 第62-79页 |
4.1 整体结构 | 第62-63页 |
4.2 协调节点 | 第63-67页 |
4.2.1 数据格式 | 第64页 |
4.2.2 处理流程 | 第64-66页 |
4.2.3 发射与应答 | 第66-67页 |
4.2.4 元数据容错 | 第67页 |
4.3 计算节点 | 第67-76页 |
4.3.1 批次协调器 | 第68-69页 |
4.3.2 Emmiter | 第69-70页 |
4.3.3 Source | 第70-71页 |
4.3.4 Processor | 第71-76页 |
4.4 存储模块 | 第76-77页 |
4.5 拓扑解析 | 第77-78页 |
4.6 本章小结 | 第78-79页 |
第五章 测试与分析 | 第79-92页 |
5.1 测试准备 | 第79页 |
5.2 扩展性测试 | 第79-80页 |
5.3 对比测试 | 第80-86页 |
5.3.1 时延对比测试 | 第80-82页 |
5.3.2 吞吐量对比测试 | 第82-83页 |
5.3.3 计算失败对比测试 | 第83-84页 |
5.3.4 故障恢复对比测试 | 第84-86页 |
5.4 实际应用 | 第86-91页 |
5.4.1 应用分析 | 第86-89页 |
5.4.2 系统部署 | 第89-90页 |
5.4.3 应用测试 | 第90-91页 |
5.5 总结与讨论 | 第91页 |
5.6 本章小结 | 第91-92页 |
第六章 结束语 | 第92-94页 |
6.1 全文总结 | 第92页 |
6.2 后续工作展望 | 第92-94页 |
致谢 | 第94-95页 |
参考文献 | 第95-98页 |
攻读硕士学位期间的研究成果 | 第98-99页 |