大规模流计算系统的基准测试研究

摘要	第3-5页
ABSTRACT	第5-6页
缩略语对照表	第12-13页
第一章绪论	第13-19页
1.1 研究背景	第13-14页
1.2 研究现状	第14-16页
1.3 本文的解决方案及贡献	第16-17页
1.4 本章小结	第17-19页
第二章相关工作	第19-29页
2.1 流计算	第19-21页
2.2 大规模流计算系统	第21-24页
2.2.1 Yahoo S4	第21-22页
2.2.2 Apache Spark Streaming	第22-23页
2.2.3 Apache Storm	第23页
2.2.4 Apache Samza	第23-24页
2.3 相关基准测试标准	第24-28页
2.3.1 流数据处理系统 (DSMS) 的基准测试标准	第25页
2.3.2 大规模批处理系统基准测试标准	第25-27页
2.3.3 大规模流计算系统基准测试研究现状	第27-28页
2.4 本章小结	第28-29页
第三章问题定义	第29-33页
3.1 挑战分析	第29-30页
3.2 需求定义	第30-31页
3.3 本章小结	第31-33页
第四章 Stream Bench定义	第33-47页
4.1 方法论介绍	第33-34页
4.2 数据集定义和数据生成方式约定	第34-39页
4.2.1 数据集定义	第35-36页
4.2.2 数据生成方式约定	第36-39页
4.3 程序集定义	第39-42页
4.3.1 选定方法	第39-40页
4.3.2 具体定义	第40-42页
4.4 工作流集和度量标准定义	第42-46页
4.4.1 测试方法说明	第43页
4.4.2 分析与定义	第43-46页
4.5 本章小结	第46-47页
第五章 Stream Bench具体实现	第47-59页
5.1 流数据生成的实现	第48-50页
5.1.1 实现	第48-49页
5.1.2 优化	第49-50页
5.2 Apache Spark Streaming平台下的实现	第50-55页
5.2.1 程序集的实现	第51-54页
5.2.2 度量标准获取的方式	第54-55页
5.3 Apache Storm平台下的实现	第55-58页
5.3.1 程序集的实现	第56-57页
5.3.2 度量标准获取的方式	第57-58页
5.4 本章小结	第58-59页
第六章 Stream Bench实验验证	第59-73页
6.1 Spark Streaming和Storm的对比	第59-68页
6.1.1 实验环境	第59-60页
6.1.2 面向性能工作流集测试结果	第60-63页
6.1.3 面向性能多接收者工作流集测试结果	第63-65页
6.1.4 面向故障恢复工作流集测试结果	第65-67页
6.1.5 面向持久性工作流集测试结果	第67-68页
6.2 不同Storm版本的比较	第68-69页
6.3 衡量Spark Streaming可靠Kafka传输新功能的性能开销	第69-72页
6.4 本章小结	第72-73页
第七章总结与展望	第73-75页
7.1 全文总结	第73-74页
7.2 工作展望	第74-75页
参考文献	第75-79页
致谢	第79-81页
攻读学位期间发表的学术论文目录	第81-83页