摘要 | 第9-10页 |
ABSTRACT | 第10-11页 |
第一章 绪论 | 第12-20页 |
1.1 研究背景 | 第12-13页 |
1.2 国内外研究现状 | 第13-16页 |
1.3 研究内容及意义 | 第16-18页 |
1.4 论文组织结构 | 第18-20页 |
第二章 相关技术 | 第20-30页 |
2.1 Apache Spark分布式计算引擎 | 第20-23页 |
2.1.1 Spark概述 | 第20-21页 |
2.1.2 Spark程序执行架构 | 第21-22页 |
2.1.3 弹性数据集RDD | 第22-23页 |
2.2 数据本地性(Data Locality) | 第23-26页 |
2.2.1 Hadoop数据本地性 | 第24页 |
2.2.2 Spark数据本地性 | 第24-26页 |
2.3 NoSQL数据库 | 第26-28页 |
2.3.1 NoSQL数据库概述 | 第26-27页 |
2.3.2 NoSQL数据库存储模型 | 第27页 |
2.3.3 NoSQL数据库分区策略 | 第27-28页 |
2.4 HBase数据库 | 第28-29页 |
2.4.1 HBase基本架构 | 第28-29页 |
2.4.2 HBase数据模型 | 第29页 |
2.5 本章小结 | 第29-30页 |
第三章 集成框架设计 | 第30-45页 |
3.1 Spark计算过程分析 | 第30-36页 |
3.1.1 RDD Objects构建 | 第31页 |
3.1.2 Task调度 | 第31-35页 |
3.1.3 Task计算 | 第35页 |
3.1.4 计算结果汇总 | 第35-36页 |
3.2 集成框架总体设计 | 第36-41页 |
3.2.1 集成框架设计分析 | 第36-38页 |
3.2.2 集成框架模型设计 | 第38-39页 |
3.2.3 集成框架接口规范 | 第39-41页 |
3.3 集成架构设计 | 第41-43页 |
3.3.1 集成架构分析 | 第41-42页 |
3.3.2 NoSQL数据库作为输入和输出源 | 第42页 |
3.3.3 Spark和HDFS、NoSQL数据库混合集成架构 | 第42-43页 |
3.4 本章小结 | 第43-45页 |
第四章 集成框架实现 | 第45-54页 |
4.1 集成框架模块实现 | 第45-52页 |
4.1.1 分片映射模块 | 第45-46页 |
4.1.2 数据集抽象模块 | 第46-50页 |
4.1.3 空数据集抽象模块 | 第50-51页 |
4.1.4 RDD输入接口 | 第51页 |
4.1.5 RDD写回接口 | 第51-52页 |
4.2 集成框架接口规范的基本实现 | 第52页 |
4.3 基于集成框架的Spark任务执行流程 | 第52-53页 |
4.4 本章小结 | 第53-54页 |
第五章 基于框架的SPARK与HBASE集成设计与实现 | 第54-69页 |
5.1 Spark与HBase集成的系统需求分析 | 第54-57页 |
5.1.1 功能性需求分析 | 第54-56页 |
5.1.2 非功能性需求分析 | 第56-57页 |
5.2 Spark与HBase集成的系统设计与实现 | 第57-62页 |
5.2.1 Spark与HBase集成的系统设计 | 第57-58页 |
5.2.2 Spark与HBase集成的系统实现 | 第58-62页 |
5.3 系统部署与测试 | 第62-68页 |
5.3.1 系统部署 | 第62-64页 |
5.3.2 系统测试 | 第64-68页 |
5.4 本章小结 | 第68-69页 |
第六章 总结与展望 | 第69-71页 |
6.1 全文总结 | 第69-70页 |
6.2 对未来研究工作的展望 | 第70-71页 |
参考文献 | 第71-74页 |
致谢 | 第74-75页 |
作者在学期间取得的学术成果 | 第75页 |