首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的数据挖掘算法并行化研究

摘要第6-7页
ABSTRACT第7-8页
第1章 绪论第11-16页
    1.1 研究背景及意义第11-12页
    1.2 研究现状第12-14页
    1.3 主要研究工作第14-15页
    1.4 论文组织结构第15-16页
第2章 相关技术研究第16-23页
    2.1 数据挖掘概述第16-21页
        2.1.1 数据挖掘发展史第16页
        2.1.2 数据挖掘基本流程第16-18页
        2.1.3 聚类分析第18-19页
        2.1.4 分类第19-21页
    2.2 Hadoop平台第21-23页
        2.2.1 HDFS第22-23页
        2.2.2 Yarn第23页
        2.2.3 MapReduce第23页
    2.3 本章小结第23页
第3章 CANOPY KMEANS算法并行化设计第23页
    3.1 Kmeans算法第23页
    3.2 Canopy算法第23页
    3.3 Canopy_Kmeans算法的并行设计第23页
    3.4 Canopy_Kmeans算法的并行实现第23页
    3.5 实验结果与分析第23页
    3.6 本章小结第23页
第4章 SRF算法并行化设计第23-58页
    4.1 决策树第23页
        4.1.1 决策树简介第23页
        4.1.2 决策树节点分裂准则第23页
        4.1.3 决策树存在问题第23页
    4.2 随机森林第23页
        4.2.1 随机森林简介第23页
        4.2.2 随机森林算法问题第23页
            4.2.2.1 树的数量第23页
            4.2.2.2 属性特征的选择第23页
    4.3 SRF算法设计第23页
        4.3.1 SRF算法中决策树精度的改进策略第23页
        4.3.2 SRF算法中属性特征子空间的选择策略第23页
        4.3.3 SRF算法中应对非平衡数据集的策略第23页
        4.3.4 SRF算法中决策树模型的选择策略第23页
        4.3.5 SRF算法的串行设计第23页
    4.4 SRF算法并行设计第23页
    4.5 SRF算法并行实现第23页
    4.6 实验结果与分析第23页
    4.7 本章小结第23-58页
总结与展望第58-59页
致谢第59-60页
参考文献第60-64页
攻读硕士学位期间发表的文章第64页

论文共64页,点击 下载论文
上一篇:迷走神经刺激治疗难治性癫痫患者术后疗效分析及认知功能评价
下一篇:寿胎丸对肾虚—黄体功能不全性流产大鼠kisspeptin-10的影响