首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Hadoop分布式数据清洗方案--一种基于孤立点挖掘的Hadoop数据清洗算法的研究

摘要第1-6页
Abstract第6-11页
第一章 绪论第11-15页
   ·论文研究背景及意义第11-12页
     ·论文研究背景第11-12页
     ·论文研究意义第12页
   ·相关课题国内外研究现状第12-13页
     ·国外研究现状第12-13页
     ·国内研究现状第13页
   ·论文研究内容和组织结构第13-14页
   ·本章小结第14-15页
第二章 Hadoop 平台介绍第15-25页
   ·Hadoop 平台简介第15-17页
   ·Hadoop 平台相关技术简介第17-24页
     ·HDFS 分布式文件系统第17-20页
     ·Map/Reduce 并行计算架构第20-23页
     ·Hadoop 相关子项目介绍第23-24页
   ·本章小结第24-25页
第三章 数据清洗技术、孤立点介绍及相关算法研究第25-31页
   ·数据清洗概述第25-26页
   ·孤立点算法分析第26-30页
     ·孤立点简述第26-27页
     ·基于统计的孤立点算法第27页
     ·基于距离的孤立点算法第27-28页
     ·基于密度的孤立点算法第28-29页
     ·基于偏离的孤立点算法第29页
     ·基于关联的孤立点算法第29-30页
   ·本章小结第30-31页
第四章 Hadoop 分布式数据清洗方案第31-36页
   ·典型数据清洗方案构成第31页
   ·基于 Hadoop 分布式数据清洗方案的分析和设计第31-35页
     ·需求分析第31页
     ·基本设计思想第31-33页
     ·方案设计第33-35页
   ·小结第35-36页
第五章 基于 Hadoop 的分布式孤立点挖掘算法第36-60页
   ·提出问题及相关定义第36-39页
     ·问题描述第36-37页
     ·点与 MBR 的距离第37-39页
   ·算法思想第39-42页
     ·块嵌套循环算法和基于索引算法第39-41页
     ·区域划分算法第41-42页
   ·算法流程第42-51页
     ·区域划分第42-44页
     ·区域的上下限的计算第44-46页
     ·候选区域的计算第46-50页
     ·基于候选区域孤立点的计算第50-51页
   ·算法实现第51-58页
     ·区域划分的算法实现第51-53页
     ·区域的上下限计算的算法实现第53-55页
     ·候选区域计算的算法实现第55-56页
     ·基于候选区域的孤立点计算的算法实现第56-58页
   ·本章小结第58-60页
第六章 实验及算法评测第60-71页
   ·集群环境平台的构建第60-67页
     ·硬件环境第60页
     ·软件环境第60-61页
     ·Hadoop 平台的安装部署第61-67页
   ·算法试验结果分析第67-70页
   ·本章小结第70-71页
结论第71-72页
 总结第71页
 展望第71-72页
参考文献第72-74页
攻读硕士学位期间取得的研究成果第74-75页
致谢第75页

论文共75页,点击 下载论文
上一篇:分布式搜索引擎系统的分发调度与融合排序
下一篇:协同过滤推荐系统用户概貌注入攻击检测研究