首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce的k-means聚类算法并行化研究

摘要第3-5页
ABSTRACT第5-6页
第一章 绪论第11-18页
    1.1 选题背景第11-13页
    1.2 国内外研究现状及发展动态第13-15页
    1.3 研究意义第15-17页
    1.4 论文创新之处第17-18页
第二章 Hadoop相关介绍第18-24页
    2.1 MapReduce分布式计算框架第18-20页
    2.2 HDFS分布式数据库第20-21页
    2.4 Hbase数据库第21-24页
第三章 Web日志分析第24-28页
    3.1 web日志第24-25页
    3.2 web日志挖掘第25-26页
    3.3 基于Flume的web日志收集第26-28页
第四章 基于Hadoop的日志信息处理第28-34页
    4.1 Web日志预处理第28-29页
    4.2 Hadoop处理web日志的操作第29-34页
        4.2.1 MapReduce对web日志分析信息第30-33页
        4.2.2 基于MapReduce的数据连接操作第33-34页
第五章 基于MapReduce的k-means聚类算法第34-40页
    5.1 k-means聚类算法第34-35页
    5.2 聚类初值的确定第35-37页
    5.3 聚类算法的MapReduce实现第37-38页
    5.4 对日志数据进行聚类分析第38-40页
第六章、实验设计与结果分析第40-43页
    6.1 实验的数据集和实验平台搭建第40页
    6.2 实验结果分析第40-43页
结论与展望第43-44页
参考文献第44-48页
致谢第48-49页
攻读学位期间发表的学术论文目录第49页

论文共49页,点击 下载论文
上一篇:基于分布式架构的智能车辆管理系统设计与实现
下一篇:基于MWC的模拟信息转换技术研究