基于HBase的交通大数据查询优化研究

摘要	第4-5页
Abstract	第5页
1 绪论	第8-12页
1.1 课题研究背景与意义	第8-9页
1.2 研究现状	第9-10页
1.3 本文的主要研究内容	第10页
1.4 本文的组织架构	第10-12页
2 云存储技术基础	第12-22页
2.1 非关系型数据库(NoSQL,NotOnlySQL)	第12页
2.2 基于HDFS的HBase	第12-18页
2.2.1 数据读写	第14-15页
2.2.2 预写日志(WAL,WriteAheadLog)	第15-16页
2.2.3 缓存机制	第16-17页
2.2.4 底层文件HFile	第17-18页
2.3 基于HBase的分布式SQL解析引擎	第18-21页
2.3.1 将SQL整合到HBase的优势	第19页
2.3.2 批式查询引擎Hive	第19-20页
2.3.3 交互式查询引擎Phoenix	第20-21页
2.4 本章小结	第21-22页
3 基于HBase的交通大数据存储查询平台的设计及实现	第22-36页
3.1 整体架构设计	第22-23页
3.2 基于HBase的存储层设计	第23-31页
3.2.1 HBase行键(RowKey)设计	第23-25页
3.2.2 基于MapReduce的二级索引设计	第25-29页
3.2.3 基于HBase的存储实现	第29-31页
3.3 基于Phoenix的处理层设计	第31-33页
3.3.1 Phoenix简介	第31-32页
3.3.2 Phoenix查询实现	第32页
3.3.3 性能对比	第32-33页
3.4 基于JSP的交通应用层设计	第33-35页
3.4.1 交通应用层的实现	第33-34页
3.4.2 基本功能	第34-35页
3.5 本章小结	第35-36页
4 基于机器学习的HBase配置参数优化	第36-50页
4.1 HBase配置参数	第36-38页
4.1.1 HBase配置参数简介	第36-37页
4.1.2 参数调优面临的挑战	第37-38页
4.2 基于YCSB的数据收集	第38-41页
4.2.1 YCSB原理	第38-39页
4.2.2 数据收集	第39-41页
4.3 基于随机森林的模型建立	第41-44页
4.3.1 随机森林原理	第41-42页
4.3.2 性能模型建立	第42页
4.3.3 实验设置	第42-44页
4.4 基于遗传算法的最优参数搜索	第44-46页
4.4.1 遗传算法原理	第44-45页
4.4.2 最优参数搜索	第45页
4.4.3 实验设置	第45-46页
4.5 性能加速比	第46-49页
4.6 本章小结	第49-50页
5 实验说明	第50-54页
5.1 实验环境	第50-52页
5.1.1 Hadoop安装	第50-51页
5.1.2 HBase安装	第51-52页
5.2 实验数据	第52-54页
结论	第54-55页
致谢	第55-56页
参考文献	第56-57页