首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

大数据环境下数据质量关键问题研究

摘要第5-6页
Abstract第6-7页
1 引言第11-15页
    1.1 课题背景及意义第11-12页
    1.2 国内外研究现状第12-13页
    1.3 研究内容第13页
    1.4 论文的组织结构第13-14页
    1.5 本章小结第14-15页
2 Map-Reduce、Hadoop与聚类分析第15-31页
    2.1 Map-Reduce第15-17页
        2.1.1 Map-Reduce介绍第15-17页
        2.1.2 Map-Reduce执行过程第17页
    2.2 Hadoop第17-22页
        2.2.1 Hadoop介绍第17-19页
        2.2.2 Hadoop特性与优势第19-20页
        2.2.3 Hadoop运行过程第20-22页
    2.3 聚类分析第22-28页
        2.3.1 聚类分析介绍第22-23页
        2.3.2 样本差异性标准第23-24页
        2.3.3 类簇差异性标准第24-25页
        2.3.4 聚类算法第25-28页
    2.4 本章小结第28-31页
3 聚类算法的分析第31-39页
    3.1 K-means聚类算法第31-34页
        3.1.1 算法的基本原理第31-32页
        3.1.2 算法结构分析第32-34页
        3.1.3 不足之处第34页
    3.2 K-medoids聚类算法第34-38页
        3.2.1 算法的基本原理第34-35页
        3.2.2 Levenshtein距离第35-36页
        3.2.3 算法结构分析第36-37页
        3.2.4 不足之处第37-38页
    3.3 本章小结第38-39页
4 基于Map-Reduce的聚类算法的设计与实现第39-53页
    4.1 E-medoids聚类算法第39-42页
        4.1.1 算法基本原理第39页
        4.1.2 算法结构分析第39-41页
        4.1.3 流程图第41页
        4.1.4 伪代码第41-42页
    4.2 EW-medoids聚类算法第42-45页
        4.2.1 算法基本原理第42页
        4.2.2 算法结构分析第42-44页
        4.2.3 流程图第44页
        4.2.4 伪代码第44-45页
    4.3 基于Map-Reduce的聚类算法第45-49页
        4.3.1 算法基本原理第45-46页
        4.3.2 算法结构分析第46-47页
        4.3.3 算法时间复杂度及适用性第47-48页
        4.3.4 算法流程图第48页
        4.3.5 伪代码实现第48-49页
    4.4 Map-Reduce各类的实现第49-51页
        4.4.1 Mapper类伪代码实现第49页
        4.4.2 Reducer类伪代码实现第49-50页
        4.4.3 Map-Reduce任务伪代码实现第50-51页
    4.5 本章小结第51-53页
5 仿真与实验第53-65页
    5.1 实验环境第53-56页
        5.1.1 硬件参数第53页
        5.1.2 SSH安装与配置第53-54页
        5.1.3 Hadoop配置第54-56页
    5.2 实验数据生成第56-58页
        5.2.1 单机实验数据生成第56-57页
        5.2.2 集群实验数据生成第57-58页
    5.3 结果与分析第58-62页
        5.3.1 算法的运行效率第58-60页
        5.3.2 参数E对算法的影响第60-61页
        5.3.3 算法精确性第61-62页
        5.3.4 Hadoop平台上数据集规模对算法的影响第62页
    5.4 本章小结第62-65页
6 总结与展望第65-67页
    6.1 工作总结第65页
    6.2 今后工作展望第65-67页
参考文献第67-69页
致谢第69-70页
个人简历第70-71页
发表的学术论文第71页

论文共71页,点击 下载论文
上一篇:基于SMA驱动的仿生水母机器人技术研究
下一篇:基于暗原色先验与Retinex算法相结合的图像去雾新方法的研究