摘要 | 第3-4页 |
Abstract | 第4页 |
第1章 绪论 | 第8-15页 |
1.1 研究背景与意义 | 第8页 |
1.2 国内外研究现状 | 第8-11页 |
1.2.1 国内研究现状 | 第8-9页 |
1.2.2 国外研究现状 | 第9页 |
1.2.3 相关研究应用 | 第9-11页 |
1.3 课题的研究内容 | 第11-14页 |
1.3.1 MapReduce 工作机理的分析研究 | 第11-13页 |
1.3.2 MapReduce 应用研究 | 第13-14页 |
1.4 论文的组织结构 | 第14-15页 |
第2章 系统原理概述 | 第15-28页 |
2.1 Hadoop 基本架构 | 第15-17页 |
2.2 HDFS 分布式文件系统 | 第17-23页 |
2.2.1 HDFS 概述 | 第18-20页 |
2.2.2 数据块 | 第20页 |
2.2.3 Namenode 和 Datanode | 第20-22页 |
2.2.4 命令行接口 | 第22页 |
2.2.5 HDFS 体系结构 | 第22-23页 |
2.3 MapReduce | 第23-28页 |
2.3.1 Map 任务 | 第24页 |
2.3.2 分组和聚合 | 第24-25页 |
2.3.3 Reduce 任务 | 第25页 |
2.3.4 组合器 | 第25页 |
2.3.5 Map-Reduce 的执行细节 | 第25-27页 |
2.3.6 节点失效的处理 | 第27-28页 |
第3章 MapReduce 算法 | 第28-45页 |
3.1 使用 MapReduce 的算法 | 第28-37页 |
3.1.1 基于 Map-Reduce 的矩阵-向量乘法实现 | 第28-29页 |
3.1.2 向量 V 无法放入内存时的处理 | 第29-30页 |
3.1.3 关系代数运算 | 第30-32页 |
3.1.4 基于 Map-Reduce 的选择运算 | 第32-33页 |
3.1.5 基于 Map-Reduce 的投影运算 | 第33页 |
3.1.6 基于 Map-Reduce 的并、交和差运算 | 第33-34页 |
3.1.7 基于 Map-Reduce 的自然连接运算 | 第34-35页 |
3.1.8 一般性的连接算法 | 第35页 |
3.1.9 基于 Map-Reduce 的分组和聚合运算 | 第35页 |
3.1.10 矩阵乘法 | 第35-37页 |
3.1.11 基于单步 Map-Reduce 的矩阵乘法 | 第37页 |
3.2 MapReduce 的扩展 | 第37-41页 |
3.2.1 工作流系统 | 第38-39页 |
3.2.2 Map-Reduce 的递归扩展版本 | 第39-41页 |
3.3 MapReduce 在 Hadoop 中的应用 | 第41-45页 |
3.3.1 MapReduce 任务的执行总流程 | 第42-43页 |
3.3.2 错误处理机制 | 第43-45页 |
第4章 MapReduce 应用研究 | 第45-52页 |
4.1 词频统计 | 第45-48页 |
4.1.1 实例描述 | 第45页 |
4.1.2 设计思路 | 第45-46页 |
4.1.3 算法流程 | 第46-48页 |
4.2 文件搜索 | 第48-52页 |
4.2.1 实例描述 | 第48页 |
4.2.2 设计思路 | 第48-49页 |
4.2.3 算法流程 | 第49-52页 |
第5章 构建实验平台 | 第52-64页 |
5.1 实验环境 | 第52-53页 |
5.1.1 Ubuntu_11.10 | 第52页 |
5.1.2 JDK_1.6 | 第52页 |
5.1.3 Hadoop_1.0.1 | 第52页 |
5.1.4 SSH | 第52-53页 |
5.2 平台配置 | 第53-58页 |
5.2.1 安装 JDK | 第53-54页 |
5.2.2 配置 SSH 免密码登录 | 第54-55页 |
5.2.3 配置 Hadoop 集群 | 第55-58页 |
5.3 有关实验与结果分析 | 第58-62页 |
5.3.1 WordCount 运行实例 | 第58-60页 |
5.3.2 文件搜索实例 | 第60-62页 |
5.4 实验总结 | 第62-64页 |
第6章 未来研究工作及展望 | 第64-65页 |
参考文献 | 第65-67页 |
致谢 | 第67-68页 |
附录一 词频统计算法代码 | 第68-71页 |
附录二 文件搜索算法代码 | 第71-75页 |