首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的数据挖掘算法的研究

摘要第5-6页
Abstract第6页
第1章 绪论第9-12页
    1.1 课题背景及研究的目的和意义第9-10页
        1.1.1 课题背景第9页
        1.1.2 课题意义第9-10页
    1.2 国内外研究现状第10页
    1.3 论文研究内容第10页
    1.4 论文组织结构第10-12页
第2章 Hadoop核心框架研究第12-22页
    2.1 Hadoop概述第12-13页
        2.1.1 Hadoop优势第12页
        2.1.2 Hadoop子项目第12-13页
    2.2 MapReduce编程模型第13-17页
        2.2.1 MapReduce简介第13-14页
        2.2.2 MapReduce编程模型第14页
        2.2.3 MapReduce任务流程第14-16页
        2.2.4 MapReduce关键技术第16-17页
    2.3 分布式文件系统HDFS第17-21页
        2.3.1 HDFS特点和目标第17-18页
        2.3.2 HDFS体系结构第18-19页
        2.3.3 HDFS性能分析第19-21页
    2.4 本章小结第21-22页
第3章 聚类与K-means算法第22-25页
    3.1 聚类分析第22页
    3.2 K-means算法描述第22-23页
    3.3 K-means算法性能分析第23-24页
    3.4 K-means算法的并行化第24页
    3.5 本章小结第24-25页
第4章 K-means算法的改进第25-33页
    4.1 数据抽样第25-26页
    4.2 寻找最佳初始聚类中心第26-28页
        4.2.1 求解凸包第26-27页
        4.2.2 求解对踵点第27-28页
    4.3 聚类中心临近点的确定第28页
    4.4 求解剩余聚类中心第28-30页
    4.5 聚类个数k的确定第30-31页
    4.6 改进算法整体描述第31-32页
    4.7 本章小结第32-33页
第5章 改进算法的并行化实现第33-41页
    5.1 数据预处理第33-35页
    5.2 数据抽样的并行实现第35页
    5.3 剩余聚类中心算法的并行实现第35-37页
    5.4 K-means算法的并行实现第37-40页
    5.5 本章小结第40-41页
第6章 改进算法的实验与分析第41-47页
    6.1 实验平台第41-43页
        6.1.1 硬件环境第41页
        6.1.2 软件环境第41页
        6.1.3 搭建Hadoop集群第41-43页
    6.2 实验过程第43-46页
        6.2.1 数据预处理第43页
        6.2.2 实验结果与分析第43-46页
    6.3 本章小结第46-47页
第7章 总结与展望第47-49页
    7.1 论文的总结第47页
    7.2 未来展望第47-49页
参考文献第49-52页
致谢第52页

论文共52页,点击 下载论文
上一篇:基于电容层析成像系统(EGT)的燃烧实验及三维成像研究
下一篇:基于数据挖掘的供电企业客户关系评估及系统开发