MapReduce框架下带范围的空间文本相似连接

摘要	第5-6页
Abstract	第6页
第1章绪论	第10-16页
1.1 研究背景及意义	第10-11页
1.2 国内外研究现状	第11-14页
1.3 研究内容	第14页
1.4 论文结构	第14-16页
第2章基础知识	第16-22页
2.1 Hadoop相关知识介绍	第16-20页
2.1.1 分布式文件系统（HDFS）技术介绍	第16-18页
2.1.2 Hadoop计算模型——Map Reduce	第18-20页
2.2 空间文本数据相关知识介绍	第20页
2.3 倒排索引	第20-21页
2.4 本章小结	第21-22页
第3章基于阈值的带范围的空间文本相似连接	第22-36页
3.1 研究背景	第22-23页
3.2 问题描述	第23页
3.3 数据划分和过滤技术	第23-29页
3.3.1 数据划分	第23-26页
3.3.2 基于M限制矩形的数据划分	第26-29页
3.3.3 空间过滤	第29页
3.3.4 文本过滤	第29页
3.4 并行空间文本相似连接	第29-32页
3.4.1 stage1：整体序的产生	第30-31页
3.4.2 stage2：基于MR的空间文本相似连接	第31-32页
3.5 算法描述	第32-34页
3.6 冗余避免策略	第34-35页
3.7 本章小结	第35-36页
第4章基于评分的带范围的空间文本top-k连接	第36-46页
4.1 研究背景	第36页
4.2 问题描述	第36-37页
4.3 索引的构建和提前终止策略	第37-42页
4.3.1 构建空间索引	第37-39页
4.3.2 top-k的提前终止策略	第39-42页
4.4 Top-k连接过程	第42-45页
4.4.1 Stage1：文本标签的整体序的产生	第42页
4.4.2 Stage2：计算每个reducer内的top-k	第42-44页
4.4.3 Stage3：全局top-k	第44-45页
4.5 本章小结	第45-46页
第5章实验结果与分析	第46-51页
5.1 实验环境设置	第46页
5.2 基于阈值的带范围的空间文本相似连接实验结果与分析	第46-48页
5.2.1 网格边长的影响	第46-47页
5.2.2 网格边长和阈值的影响	第47-48页
5.2.3 节点个数和数据集大小的影响	第48页
5.3 基于评分的带范围的空间文本top-k连接实验结果与分析	第48-50页
5.3.1 空间索引网格大小的影响	第48-49页
5.3.2 k的影响	第49页
5.3.3 数据集大小的影响	第49-50页
5.4 本章小结	第50-51页
结论	第51-53页
参考文献	第53-57页
攻读硕士学位期间承担的科研任务与主要成果	第57-58页
致谢	第58-59页
作者简介	第59页