首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop云计算平台的K-Means聚类算法研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第10-15页
    1.1 研究目的及意义第10页
    1.2 国内外发展现状第10-14页
    1.3 本文研究的主要内容第14-15页
第2章 相关技术研究与分析第15-28页
    2.1 Hadoop云计算平台第15-24页
        2.1.1 系统架构概述第15-16页
        2.1.2 分布式文件系统HDFS第16-21页
        2.1.3 分布式计算框架Map Reduce第21-24页
    2.2 数据挖掘及聚类分析第24-27页
        2.2.1 数据挖掘技术第24-25页
        2.2.2 聚类分析定义及改进方向第25-26页
        2.2.3 聚类分析方法第26-27页
    2.3 本章小结第27-28页
第3章 聚类分析系统的设计与实现第28-41页
    3.1 系统简介第28-30页
        3.1.1 开发环境介绍第28-29页
        3.1.2 总体架构概述第29-30页
    3.2 底层环境搭建第30-36页
        3.2.1 Hadoop集群部署第31-32页
        3.2.2 环境配置与服务搭建第32-36页
    3.3 中间逻辑层实现第36-38页
        3.3.1 数据管理模块第36-37页
        3.3.2 算法管理模块第37页
        3.3.3 资源监控模块第37-38页
        3.3.4 日志分析模块第38页
    3.4 对外服务层实现第38-40页
    3.5 本章小结第40-41页
第4章K-Means并行算法的改进第41-54页
    4.1 传统K-Means算法第41-43页
        4.1.1 算法概念第41页
        4.1.2 算法公式第41-42页
        4.1.3 算法执行流程第42-43页
        4.1.4 算法存在的问题第43页
    4.2 K-Means算法改进方案第43-46页
        4.2.1 并行随机采样第43-44页
        4.2.2 样本距离计算并行化第44-45页
        4.2.3 数据对象聚类并行化第45-46页
    4.3 改进的K-Means并行算法实现第46-48页
    4.4 聚类分析系统环境下的算法实验第48-53页
        4.4.1 聚类分析系统实验环境介绍第48-49页
        4.4.2 收敛速度比较第49-50页
        4.4.3 正确率比较第50-51页
        4.4.4 初始化采样速率比较第51-52页
        4.4.5 集群环境加速比验证第52-53页
    4.5 本章小结第53-54页
结论第54-55页
参考文献第55-59页
攻读硕士学位期间发表的学术论文第59-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:三维表面粗糙度测量与评定
下一篇:关于人工智能的哲学思考