摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
1 绪论 | 第9-15页 |
1.1 研究背景及意义 | 第9-11页 |
1.2 国内外研究现状 | 第11-12页 |
1.2.1 分布式空间数据库技术的当前现状 | 第11-12页 |
1.2.2 Hive在分布式数据库的现状 | 第12页 |
1.3 研究方法及内容 | 第12-13页 |
1.4 论文组织结构 | 第13-15页 |
2 理论基础与关键技术 | 第15-29页 |
2.1 空间数据库基础 | 第15-18页 |
2.1.1 空间数据 | 第15-16页 |
2.1.2 空间数据关系 | 第16页 |
2.1.3 空间索引 | 第16-17页 |
2.1.4 分布式空间数据库基础 | 第17-18页 |
2.2 空间数据库模型 | 第18-21页 |
2.2.1 空间数据库模型发展历程 | 第18-19页 |
2.2.2 Geodatabase空间数据模型 | 第19-21页 |
2.3 基于Hadoop的分布式计算框架 | 第21-27页 |
2.3.1 分布式文件系统HDFS | 第22-23页 |
2.3.2 计算框架MapReduce | 第23页 |
2.3.3 数据仓库工具Hive | 第23-26页 |
2.3.4 Hive、MapReduce、Hadoop之间的关系 | 第26-27页 |
2.4 本章小结 | 第27-29页 |
3 扩展Hive的分布式空间数据库的分析与研究 | 第29-33页 |
3.1 结构体系设计 | 第29-30页 |
3.1.1 分布式空间系统的设计目标 | 第29页 |
3.1.2 分布式空间计算系统DSQ总体架构 | 第29-30页 |
3.2 空间数据管理 | 第30-31页 |
3.3 关键字查询的优化 | 第31-32页 |
3.4 本章小结 | 第32-33页 |
4 基于Hive的分布式空间查询扩展实现与优化 | 第33-41页 |
4.1 Hive框架的扩展 | 第33-35页 |
4.2 HIVE UDF的扩展支持 | 第35页 |
4.3 针对基于Hive的查询框架的实现 | 第35-37页 |
4.4 基于空间计算特点的性能调优 | 第37-38页 |
4.4.1 Hive的数据倾斜问题 | 第37-38页 |
4.4.2 bucket的大小划分 | 第38页 |
4.4.3 合理化文件分布 | 第38页 |
4.5 本章小结 | 第38-41页 |
5 实验验证 | 第41-51页 |
5.1 实验环境 | 第41页 |
5.2 实验数据集 | 第41-42页 |
5.3 实验运行示例 | 第42-45页 |
5.4 实验与分析 | 第45-49页 |
5.4.1 数据导入性能对比 | 第45-46页 |
5.4.2 DSQ与SDBMS的比较 | 第46-48页 |
5.4.3 DSQ的扩展性 | 第48-49页 |
5.5 本章小结 | 第49-51页 |
6 总结与展望 | 第51-53页 |
参考文献 | 第53-55页 |
致谢 | 第55-57页 |
攻读学位期间的科研成果 | 第57-58页 |