首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Spark的RDF数据top-k查询计算研究

摘要第4-5页
Abstract第5页
第1章 绪论第8-11页
    1.1 课题研究的背景和意义第8-9页
    1.2 研究现状第9-10页
    1.3 本文的主要工作第10页
    1.4 本文的结构安排第10-11页
第2章 基础理论与相关知识第11-17页
    2.1 RDF与SPARQL相关知识第11-12页
        2.1.1 RDF第11-12页
        2.1.2 SPARQL第12页
    2.2 并行化编程模型及优化技术第12-13页
        2.2.1 并行化编程模型-MapReduce简介第12-13页
        2.2.2 MapReduce编程理念和原理第13页
    2.3 分布式实验平台概述第13-16页
        2.3.1 Hbase概述第13-14页
        2.3.2 Spark概述第14-16页
    2.4 本章小结第16-17页
第3章 系统构架第17-28页
    3.1 系统总体构架第17-18页
    3.2 HBase存储模块第18-22页
        3.2.1 RDF存储模型概述第18-19页
        3.2.2 HBase下的RDF存储分析第19-20页
        3.2.3 HBase下的RDF存储模型的定义第20-22页
    3.3 查询模块第22-27页
        3.3.1 SPARQL查询解析第22-23页
        3.3.2 SPARQL top-k查询第23-24页
        3.3.3 查询计划第24-27页
    3.4 本章小结第27-28页
第4章 基于Spark的Top-k查询算法第28-43页
    4.1 Top-k查询问题概述第28-29页
        4.1.1 查询模式的划分第28页
        4.1.2 排名函数特点的划分第28-29页
        4.1.3 数据访问方式的划分第29页
    4.2 top-k查询算法概述第29-30页
    4.3 Spark下的Top-k查询方案第30-39页
        4.3.1 STA算法第30-35页
        4.3.2 SSJA算法第35-39页
    4.4 Spark下查询方案的实现第39-42页
    4.5 本章小结第42-43页
第5章 实验方案结果与分析第43-49页
    5.1 实验环境第43-46页
    5.2 实验数据集第46页
    5.3 实验结果与分析第46-49页
第6章 总结与展望第49-51页
    6.1 工作总结第49页
    6.2 工作展望第49-51页
致谢第51-52页
参考文献第52-56页
附录 1 攻读硕士学位期间发表的论文第56-57页
详细摘要第57-61页

论文共61页,点击 下载论文
上一篇:流复制技术在省级地税数据分发中的应用
下一篇:面向钢铁生产流程的调度模型库系统研究