基于MapReduce的top-k查询算法研究

摘要	第5-7页
Abstract	第7-8页
1 引言	第12-18页
1.1 课题背景及意义	第12-13页
1.2 国内外现状	第13-14页
1.3 主要的问题	第14-15页
1.4 解决问题和创新点	第15-16页
1.5 论文的组织结构	第16-18页
2 Top-k 查询算法概述、相关技术及实验平台介绍	第18-34页
2.1 Top-k 查询问题概述	第18-21页
2.1.1 查询模式	第18-20页
2.1.2 数据访问方法	第20页
2.1.3 数据和查询的确定性	第20-21页
2.1.4 排名函数	第21页
2.2 典型的 top-k 查询介绍	第21-25页
2.2.1 集中式数据库的 top-k 查询算法	第21-24页
2.2.2 分布式数据库的 top-k 查询算法	第24-25页
2.3 并行编程模型及优化技术介绍	第25-27页
2.3.1 并行编程模型-MapReduce 简介	第25-26页
2.3.2 MapReduce 编程模型理念和原理	第26-27页
2.4 分布式实验平台概述	第27-32页
2.4.1 Hadoop 概述	第27页
2.4.2 Hadoop 的基本结构	第27-28页
2.4.3 Hadoop 的优势	第28-29页
2.4.4 Hadoop 的工作原理	第29-32页
2.5 本章小结	第32-34页
3 基于 MapReduce 的 top-k 查询算法 PCMRA	第34-54页
3.1 典型 top-k 查询算法的分析	第34-35页
3.2 数学模型建立	第35-38页
3.3 预处理结构	第38-47页
3.3.1 COIT 表建立	第38-45页
3.3.2 数据映射策略	第45-47页
3.4 Top-k 查询算法-PCMRA	第47-52页
3.4.1 PCMRA 算法工作原理	第47-48页
3.4.2 PCMRA 算法伪代码	第48-49页
3.4.3 PCMRA 算法流程图	第49页
3.4.4 PCMRA 算法处理示例	第49-52页
3.5 本章小结	第52-54页
4 实验仿真与分析	第54-68页
4.1 Hadoop 环境搭建	第54-59页
4.1.1 JDK 安装和 Java 环境变量配置	第54-55页
4.1.2 SSH 无密码验证配置	第55-56页
4.1.3 Hadoop 安装	第56-58页
4.1.4 Hadoop 启动	第58-59页
4.2 实验配置	第59-61页
4.2.1 实验环境	第59页
4.2.2 对比实验	第59页
4.2.3 数据集	第59-60页
4.2.4 实验参数	第60页
4.2.5 性能指标	第60页
4.2.6 查询设定	第60-61页
4.3 性能分析	第61-65页
4.3.1 均匀分布数据分析	第61-63页
4.3.2 高斯分布数据分析	第63-65页
4.4 本章小结	第65-68页
5 总结和展望	第68-70页
参考文献	第70-74页
致谢	第74-75页
个人简历	第75页
发表的学术论文	第75-76页