首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于YARN框架下决策树算法的并行化研究

摘要第3-4页
abstract第4页
第1章 绪论第7-11页
    1.1 选题背景及研究意义第7页
    1.2 国内外研究现状第7-8页
    1.3 本文的研究内容第8-9页
    1.4 论文的组织第9-11页
第2章 决策树算法的研究第11-26页
    2.1 数据挖掘概念第11页
    2.2 分类的概念及算法描述第11-13页
        2.2.1 分类概念第11页
        2.2.2 常见的分类算法第11-13页
        2.2.3 评估分类器性能的度量第13页
    2.3 决策树算法的基本过程第13-20页
        2.3.1 数据预处理第13-14页
        2.3.2 特征选择第14-16页
        2.3.3 决策树生成第16-17页
        2.3.4 剪枝第17-20页
    2.4 经典决策树算法的分析与比较第20-25页
        2.4.1 ID3算法第20-21页
        2.4.2 C4.5算法第21-22页
        2.4.3 CART算法第22-23页
        2.4.4 大规模数据集的决策树算法第23-25页
        2.4.5 决策树算法评价第25页
    2.5 本章小结第25-26页
第3章 并行化框架第26-34页
    3.1 MapReduce第26-29页
        3.1.1 MapReduce编程模型第26-27页
        3.1.2 MapReduce实现原理第27-28页
        3.1.3 MapReduce架构经典实例第28-29页
    3.2 YARN第29-32页
        3.2.1 YARN框架原理第30-31页
        3.2.2 YARN工作流程第31-32页
    3.3 YARN和Hadoop1.0对比分析第32-33页
        3.3.1 体系结构对比第32页
        3.3.2 运算框架对比第32-33页
    3.4 本章小结第33-34页
第4章 C4.5算法的优化及其在YARN框架下的并行化实现第34-47页
    4.1 决策树算法的并行化设计第34-38页
        4.1.1 属性并行第34页
        4.1.2 连续属性离散化并行第34-36页
        4.1.3 节点并行第36页
        4.1.4 剪枝并行第36-38页
    4.2 C4.5算法的优化第38-42页
        4.2.1 引入权重系数第38-40页
        4.2.2 简化信息增益率的计算第40-41页
        4.2.3 C4.5_YH算法描述第41-42页
    4.3 C4.5_YH算法的并行实现第42-46页
    4.4 本章小结第46-47页
第5章 实验过程及结果分析第47-55页
    5.1 实验平台第47-49页
        5.1.1 环境准备第47页
        5.1.2 YARN的安装和配置第47-49页
    5.2 并行算法的性能评价标准第49页
    5.3 实验验证与分析第49-54页
    5.4 本章小结第54-55页
第6章 总结与展望第55-57页
    6.1 本文总结第55页
    6.2 展望未来第55-57页
致谢第57-58页
参考文献第58-61页
攻读学位期间的研究成果第61页

论文共61页,点击 下载论文
上一篇:多尺度网络仿真技术及其应用研究
下一篇:可搜索压缩算法的设计与实现及其在ClamAV中的应用