| 摘要 | 第1-6页 |
| Abstract | 第6-11页 |
| 第一章 绪论 | 第11-15页 |
| ·论文研究背景及意义 | 第11-12页 |
| ·论文研究背景 | 第11-12页 |
| ·论文研究意义 | 第12页 |
| ·相关课题国内外研究现状 | 第12-13页 |
| ·国外研究现状 | 第12-13页 |
| ·国内研究现状 | 第13页 |
| ·论文研究内容和组织结构 | 第13-14页 |
| ·本章小结 | 第14-15页 |
| 第二章 Hadoop 平台介绍 | 第15-25页 |
| ·Hadoop 平台简介 | 第15-17页 |
| ·Hadoop 平台相关技术简介 | 第17-24页 |
| ·HDFS 分布式文件系统 | 第17-20页 |
| ·Map/Reduce 并行计算架构 | 第20-23页 |
| ·Hadoop 相关子项目介绍 | 第23-24页 |
| ·本章小结 | 第24-25页 |
| 第三章 数据清洗技术、孤立点介绍及相关算法研究 | 第25-31页 |
| ·数据清洗概述 | 第25-26页 |
| ·孤立点算法分析 | 第26-30页 |
| ·孤立点简述 | 第26-27页 |
| ·基于统计的孤立点算法 | 第27页 |
| ·基于距离的孤立点算法 | 第27-28页 |
| ·基于密度的孤立点算法 | 第28-29页 |
| ·基于偏离的孤立点算法 | 第29页 |
| ·基于关联的孤立点算法 | 第29-30页 |
| ·本章小结 | 第30-31页 |
| 第四章 Hadoop 分布式数据清洗方案 | 第31-36页 |
| ·典型数据清洗方案构成 | 第31页 |
| ·基于 Hadoop 分布式数据清洗方案的分析和设计 | 第31-35页 |
| ·需求分析 | 第31页 |
| ·基本设计思想 | 第31-33页 |
| ·方案设计 | 第33-35页 |
| ·小结 | 第35-36页 |
| 第五章 基于 Hadoop 的分布式孤立点挖掘算法 | 第36-60页 |
| ·提出问题及相关定义 | 第36-39页 |
| ·问题描述 | 第36-37页 |
| ·点与 MBR 的距离 | 第37-39页 |
| ·算法思想 | 第39-42页 |
| ·块嵌套循环算法和基于索引算法 | 第39-41页 |
| ·区域划分算法 | 第41-42页 |
| ·算法流程 | 第42-51页 |
| ·区域划分 | 第42-44页 |
| ·区域的上下限的计算 | 第44-46页 |
| ·候选区域的计算 | 第46-50页 |
| ·基于候选区域孤立点的计算 | 第50-51页 |
| ·算法实现 | 第51-58页 |
| ·区域划分的算法实现 | 第51-53页 |
| ·区域的上下限计算的算法实现 | 第53-55页 |
| ·候选区域计算的算法实现 | 第55-56页 |
| ·基于候选区域的孤立点计算的算法实现 | 第56-58页 |
| ·本章小结 | 第58-60页 |
| 第六章 实验及算法评测 | 第60-71页 |
| ·集群环境平台的构建 | 第60-67页 |
| ·硬件环境 | 第60页 |
| ·软件环境 | 第60-61页 |
| ·Hadoop 平台的安装部署 | 第61-67页 |
| ·算法试验结果分析 | 第67-70页 |
| ·本章小结 | 第70-71页 |
| 结论 | 第71-72页 |
| 总结 | 第71页 |
| 展望 | 第71-72页 |
| 参考文献 | 第72-74页 |
| 攻读硕士学位期间取得的研究成果 | 第74-75页 |
| 致谢 | 第75页 |