基于Spark的RDF数据top-k查询计算研究

摘要	第4-5页
Abstract	第5页
第1章绪论	第8-11页
1.1 课题研究的背景和意义	第8-9页
1.2 研究现状	第9-10页
1.3 本文的主要工作	第10页
1.4 本文的结构安排	第10-11页
第2章基础理论与相关知识	第11-17页
2.1 RDF与SPARQL相关知识	第11-12页
2.1.1 RDF	第11-12页
2.1.2 SPARQL	第12页
2.2 并行化编程模型及优化技术	第12-13页
2.2.1 并行化编程模型-MapReduce简介	第12-13页
2.2.2 MapReduce编程理念和原理	第13页
2.3 分布式实验平台概述	第13-16页
2.3.1 Hbase概述	第13-14页
2.3.2 Spark概述	第14-16页
2.4 本章小结	第16-17页
第3章系统构架	第17-28页
3.1 系统总体构架	第17-18页
3.2 HBase存储模块	第18-22页
3.2.1 RDF存储模型概述	第18-19页
3.2.2 HBase下的RDF存储分析	第19-20页
3.2.3 HBase下的RDF存储模型的定义	第20-22页
3.3 查询模块	第22-27页
3.3.1 SPARQL查询解析	第22-23页
3.3.2 SPARQL top-k查询	第23-24页
3.3.3 查询计划	第24-27页
3.4 本章小结	第27-28页
第4章基于Spark的Top-k查询算法	第28-43页
4.1 Top-k查询问题概述	第28-29页
4.1.1 查询模式的划分	第28页
4.1.2 排名函数特点的划分	第28-29页
4.1.3 数据访问方式的划分	第29页
4.2 top-k查询算法概述	第29-30页
4.3 Spark下的Top-k查询方案	第30-39页
4.3.1 STA算法	第30-35页
4.3.2 SSJA算法	第35-39页
4.4 Spark下查询方案的实现	第39-42页
4.5 本章小结	第42-43页
第5章实验方案结果与分析	第43-49页
5.1 实验环境	第43-46页
5.2 实验数据集	第46页
5.3 实验结果与分析	第46-49页
第6章总结与展望	第49-51页
6.1 工作总结	第49页
6.2 工作展望	第49-51页
致谢	第51-52页
参考文献	第52-56页
附录 1 攻读硕士学位期间发表的论文	第56-57页
详细摘要	第57-61页