基于Spark的海量数据实时查询系统的设计与实现

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第9-13页
1.1 研究背景与意义	第9-10页
1.2 国内外相关技术现状	第10-11页
1.3 研究内容	第11页
1.4 论文组织结构	第11-13页
第二章相关技术介绍	第13-31页
2.1 HADOOP介绍	第13-17页
2.1.1 HDFS介绍	第13-15页
2.1.2 MapReduce介绍	第15页
2.1.3 YARN介绍	第15-16页
2.1.4 Hadoop Metrics和Ganglia介绍	第16-17页
2.2 SPARK介绍	第17-23页
2.2.1 Spark Core	第18-21页
2.2.2 Spark Streaming	第21-23页
2.3 HBASE介绍	第23-29页
2.3.1 HBase数据模型	第24-25页
2.3.2 HBase架构	第25-26页
2.3.3 HBase存储方式	第26-27页
2.3.4 HBase的MapReduce扩展	第27-28页
2.3.5 HBase协处理器	第28页
2.3.6 HBase与关系型数据库	第28-29页
2.4 SQL解析介绍	第29-30页
2.5 本章小结	第30-31页
第三章数据实时查询系统的总体设计	第31-42页
3.1 总体设计概述	第31-33页
3.1.1 设计目标	第31页
3.1.2 整体架构设计	第31-33页
3.2 数据实时转换子系统的设计	第33-36页
3.2.1 关键问题解决	第33-34页
3.2.2 子系统整体结构设计	第34-35页
3.2.3 各模块功能设计	第35-36页
3.3 实时数据查询子系统的设计	第36-41页
3.3.1 关键问题解决	第36-38页
3.3.2 子系统整体结构设计	第38-39页
3.3.3 辅助索引模块	第39页
3.3.4 类SQL查询模块	第39-41页
3.4 本章小结	第41-42页
第四章数据实时查询系统的实现	第42-58页
4.1 数据块分发优化实现	第42-45页
4.1.1 DataNode的选择	第42-44页
4.1.2 数据块分发	第44-45页
4.2 数据实时转换功能的实现	第45-50页
4.2.1 任务配置文件定义	第45-47页
4.2.2 配置解析和任务生成	第47-49页
4.2.3 任务的执行	第49-50页
4.3 类SQL查询的实现	第50-54页
4.3.1 SQL语句解析	第50-53页
4.3.2 关系表和HBase表模式转化	第53-54页
4.4 HBASE辅助索引功能实现	第54-56页
4.4.1 索引表的建立	第54-55页
4.4.2 索引表的使用和管理	第55-56页
4.4.3 索引表的维护	第56页
4.5 本章小结	第56-58页
第五章系统测试及结果分析	第58-65页
5.1 实验环境	第58页
5.2 测试与性能分析	第58-64页
5.2.1 功能验证	第59-61页
5.2.2 性能测试	第61-64页
5.3 本章小结	第64-65页
第六章总结与展望	第65-67页
6.1 工作总结	第65页
6.2 下一步工作	第65-67页
参考文献	第67-69页
致谢	第69页