首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于HADOOP云计算平台的聚类算法研究

中文摘要第5-6页
英文摘要第6-7页
英文单词注释第13-14页
第一章 绪论第14-19页
    1.1 研究背景及意义第14-15页
    1.2 研究现状第15-17页
        1.2.1 产业界云计算研究现状第15-16页
        1.2.2 基于MapReduce的数据挖掘研究现状第16-17页
    1.3 本文主要工作和组织结构第17-19页
        1.3.1 主要工作第17页
        1.3.2 组织结构第17-19页
第二章 HADOOP技术架构研究第19-32页
    2.1 Hadoop技术背景第19-22页
        2.1.1 Google分布式文件系统GFS第19-21页
        2.1.2 Google MapReduce基本思想第21-22页
    2.2 HDFS分布式文件系统第22-26页
        2.2.1 HDFS系统架构第23-24页
        2.2.2 保障HDFS可靠性的措施第24-25页
        2.2.3 提升性能的措施第25-26页
    2.3 Hadoop MapReduce框架第26-31页
        2.3.1 Hadoop编程模型第27-28页
        2.3.2 Hadoop执行流程与任务调度机制第28-30页
        2.3.3 Hadoop MapReduce容错机制第30-31页
    2.4 本章小结第31-32页
第三章 非并行的聚类算法研究第32-43页
    3.1 聚类算法介绍第32-36页
        3.1.1 聚类的目的第32-33页
        3.1.2 经典聚类算法第33-34页
        3.1.3 聚类效果评价标准第34-36页
    3.2 非并行的K-Means聚类算法第36-39页
        3.2.1 距离计算方法第36-37页
        3.2.2 算法流程第37-39页
    3.3 改进的串行K-means算法第39-42页
    3.4 本章小结第42-43页
第四章 基于Hadoop的聚类算法研究第43-54页
    4.1 并行技术简介第43-45页
        4.1.1 并行计算第43页
        4.1.2 并行策略第43-44页
        4.1.3 并行算法评价标准第44-45页
    4.2 基于hadoop技术并行的Kmeans算法第45-49页
        4.2.1 Map函数与Reduce函数的设计第46-48页
        4.2.2 算法复杂度分析第48-49页
    4.3 基于hadoop技术并行的Canopy-Kmeans算法第49-52页
        4.3.1 算法基本思想第49-50页
        4.3.2 算法流程第50-52页
        4.3.3 算法复杂性分析第52页
    4.4 本章小结第52-54页
第五章 实验与分析第54-68页
    5.1 实验平台的搭建第54-60页
        5.1.1 硬件环境描述第55页
        5.1.2 软件环境描述第55页
        5.1.3 Hadoop平台的安装部署第55-60页
    5.2 hadoop性能实验与分析第60-62页
        5.2.1 wordcount基准程序测试第60-61页
        5.2.2 容错能力测试第61-62页
    5.3 并行K-means算法实验与分析第62-67页
        5.3.1 并行的K-means实验分析第62-65页
        5.3.2 可扩展性分析第65-66页
        5.3.3 canopy-kmeans实验分析第66-67页
    5.4 本章小结第67-68页
第六章 总结与展望第68-70页
    6.1 全文总结第68页
    6.2 改进方向第68-70页
致谢第70-71页
参考文献第71-73页
攻读硕士研究生期间主要成果第73-75页

论文共75页,点击 下载论文
上一篇:图像结构化特征表示方法研究及应用
下一篇:平安城市视频监控系统中异常行为识别技术研究与实现