首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce的数据清洗算法研究

摘要第6-7页
Abstract第7页
第一章 绪论第10-14页
    1.1 研究背景第10-11页
    1.2 研究现状第11-12页
        1.2.1 海量数据研究现状第11页
        1.2.2 数据清洗技术现状第11-12页
        1.2.3 海量数据下粗糙集理论应用研究现状第12页
    1.3 本文工作第12-14页
        1.3.1 论文的研究内容第12-13页
        1.3.2 论文的组织结构第13-14页
第二章 理论基础第14-24页
    2.1 粗糙集理论第14-17页
        2.1.1 粗糙集的基本概念第14-16页
        2.1.2 属性约简及其属性依赖度新度量第16-17页
    2.2 Boolean矩阵理论第17-19页
        2.2.1 等价矩阵理论及其运算第17-19页
    2.3 数据仓库技术第19-23页
        2.3.1 数据仓库技术背景第19-22页
        2.3.2 数据仓库常用工具第22-23页
    2.4 本章小节第23-24页
第三章 数据清洗第24-30页
    3.1 数据质量基本知识第24-25页
        3.1.1 数据质量定义第24页
        3.1.2 数据质量分类第24-25页
    3.2 数据清洗基本知识第25-29页
        3.2.1 数据清洗定义第25-26页
        3.2.2 数据清洗方法及分类第26-29页
    3.3 本章小节第29-30页
第四章 基于MapReduce的数据清洗算法第30-40页
    4.1 MapReduce框架第30-33页
    4.2 MapReduce环境下数据清洗的并行性分析及算法第33-36页
        4.2.1 决策表冗余对象的清洗研究第33-34页
        4.2.2 决策表不相容对象的清洗研究第34-36页
        4.2.3 算法复杂性分析第36页
    4.3 Hadoop和Spark技术分析第36-38页
    4.4 本章小节第38-40页
第五章 实验分析与性能评估第40-48页
    5.1 实验环境第40-43页
        5.1.1 Hadoop集群环境第40-41页
        5.1.2 Hadoop集群配置第41-43页
    5.2 实验分析第43-47页
        5.2.1 实例分析第43页
        5.2.2 数据集描述第43-44页
        5.2.3 实验结果分析第44-47页
    5.3 本章小节第47-48页
第六章 结束语第48-50页
致谢第50-52页
参考文献第52-56页
附录A 攻读硕士学位期间发表论文第56-57页
附录B 程序流程图第57-58页
附录C 部分程序源码第58-64页

论文共64页,点击 下载论文
上一篇:基于数据挖掘的OTA精准营销研究
下一篇:大型活动安保大数据应用平台设计与分析