首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce的top-k查询算法研究

摘要第5-7页
Abstract第7-8页
1 引言第12-18页
    1.1 课题背景及意义第12-13页
    1.2 国内外现状第13-14页
    1.3 主要的问题第14-15页
    1.4 解决问题和创新点第15-16页
    1.5 论文的组织结构第16-18页
2 Top-k 查询算法概述、相关技术及实验平台介绍第18-34页
    2.1 Top-k 查询问题概述第18-21页
        2.1.1 查询模式第18-20页
        2.1.2 数据访问方法第20页
        2.1.3 数据和查询的确定性第20-21页
        2.1.4 排名函数第21页
    2.2 典型的 top-k 查询介绍第21-25页
        2.2.1 集中式数据库的 top-k 查询算法第21-24页
        2.2.2 分布式数据库的 top-k 查询算法第24-25页
    2.3 并行编程模型及优化技术介绍第25-27页
        2.3.1 并行编程模型-MapReduce 简介第25-26页
        2.3.2 MapReduce 编程模型理念和原理第26-27页
    2.4 分布式实验平台概述第27-32页
        2.4.1 Hadoop 概述第27页
        2.4.2 Hadoop 的基本结构第27-28页
        2.4.3 Hadoop 的优势第28-29页
        2.4.4 Hadoop 的工作原理第29-32页
    2.5 本章小结第32-34页
3 基于 MapReduce 的 top-k 查询算法 PCMRA第34-54页
    3.1 典型 top-k 查询算法的分析第34-35页
    3.2 数学模型建立第35-38页
    3.3 预处理结构第38-47页
        3.3.1 COIT 表建立第38-45页
        3.3.2 数据映射策略第45-47页
    3.4 Top-k 查询算法-PCMRA第47-52页
        3.4.1 PCMRA 算法工作原理第47-48页
        3.4.2 PCMRA 算法伪代码第48-49页
        3.4.3 PCMRA 算法流程图第49页
        3.4.4 PCMRA 算法处理示例第49-52页
    3.5 本章小结第52-54页
4 实验仿真与分析第54-68页
    4.1 Hadoop 环境搭建第54-59页
        4.1.1 JDK 安装和 Java 环境变量配置第54-55页
        4.1.2 SSH 无密码验证配置第55-56页
        4.1.3 Hadoop 安装第56-58页
        4.1.4 Hadoop 启动第58-59页
    4.2 实验配置第59-61页
        4.2.1 实验环境第59页
        4.2.2 对比实验第59页
        4.2.3 数据集第59-60页
        4.2.4 实验参数第60页
        4.2.5 性能指标第60页
        4.2.6 查询设定第60-61页
    4.3 性能分析第61-65页
        4.3.1 均匀分布数据分析第61-63页
        4.3.2 高斯分布数据分析第63-65页
    4.4 本章小结第65-68页
5 总结和展望第68-70页
参考文献第70-74页
致谢第74-75页
个人简历第75页
发表的学术论文第75-76页

论文共76页,点击 下载论文
上一篇:基于HBase的移动统计平台的研究
下一篇:智能固定资产管理系统设计与实现