首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

高维数据下决策树的快速构造

摘要第5-6页
Abstract第6页
符号说明第14-15页
第1章 绪论第15-23页
    1.1 背景知识介绍第15-17页
    1.2 快速决策树构造的研究现状第17-19页
    1.3 本论文的主要工作第19-21页
        1.3.1 研究内容与要求第19-20页
        1.3.2 主要研究成果第20-21页
        1.3.3 研究成果在相关工作中的定位与比较第21页
    1.4 论文的组织结构第21-23页
第2章 快速决策树构造调研与分析第23-31页
    2.1 决策树构造过程及分析第23-25页
        2.1.1 自顶向下的决策树构造框架第23-24页
        2.1.2 计算量、内存占用、磁盘读写量分析第24-25页
        2.1.3 可扩展性分析第25页
    2.2 算法加速相关研究第25-27页
        2.2.1 计算更少特征第26页
        2.2.2 加速计算特征第26-27页
    2.3 并行化加速相关研究第27-28页
        2.3.1 不同数据划分的并行化加速方式第27-28页
        2.3.2 不同计算顺序的并行化加速方式第28页
    2.4 分析总结第28-31页
        2.4.1 现有工作的问题总结第28-29页
        2.4.2 可能的解决方法第29-31页
第3章 基于混淆度的启发式决策树算法第31-45页
    3.1 思路过程第31-32页
        3.1.1 决策树算法加速的问题分析第31-32页
        3.1.2 解决方法的核心思路第32页
    3.2 决策树算法的分裂标准第32-33页
        3.2.1 基于香农熵的信息增益第32页
        3.2.2 基于Gini Index的信息增益第32-33页
        3.2.3 基于方差的信息增益第33页
        3.2.4 基于最小均方差的信息增益第33页
    3.3 理论分析第33-36页
        3.3.1 基于信息论角度的数学分析第33-34页
        3.3.2 基于具体分裂标准的数学分析第34-35页
        3.3.3 混淆度更低的子节点存在的必然性第35-36页
    3.4 算法形式化表述第36-37页
    3.5 算法分析第37-39页
        3.5.1 算法计算量分析第37-38页
        3.5.2 算法资源占用分析第38-39页
        3.5.3 算法可并行化分析第39页
    3.6 决策树实验验证第39-45页
        3.6.1 实验目标第39页
        3.6.2 实验设置第39-41页
        3.6.3 实验结果第41-43页
        3.6.4 实验总结与分析第43-45页
第4章 基于数据横纵划分的决策树并行化第45-59页
    4.1 思路过程第45-46页
        4.1.1 并行加速的问题分析第45-46页
        4.1.2 解决方法的核心思路第46页
    4.2 并行计算的资源占用建模第46-48页
        4.2.1 内存占用的模型抽象第47-48页
        4.2.2 横纵划分方式的模型求解第48页
    4.3 基于数据横纵划分的并行算法表述第48-49页
    4.4 算法分析第49-52页
        4.4.1 计算复杂度分析第49-51页
        4.4.2 集群的磁盘读写量第51页
        4.4.3 集群的进程通信量第51-52页
        4.4.4 集群的核数、并行数和数据块第52页
    4.5 实验验证第52-59页
        4.5.1 并行实验的目标第52-53页
        4.5.2 实验设置第53-54页
        4.5.3 并行实验结果第54-57页
        4.5.4 实验总结与分析第57-59页
第5章 总结第59-63页
    5.1 论文总结第59-60页
        5.1.1 高维数据下决策树的算法加速第59-60页
        5.1.2 高维数据下决策树的并行加速第60页
    5.2 研究成果的理论意义第60-61页
    5.3 研究成果的实用价值第61-63页
参考文献第63-65页
附录A 基于Gini Index的信息增益公式推导第65-67页
附录B 基于方差的信息增益公式推导第67-69页
附录C 父节点与子节点的香农熵差公式推导第69-71页
致谢第71-73页
在读期间发表的学术论文与取得的研究成果第73页

论文共73页,点击 下载论文
上一篇:魂芯DSP软件流水框架的研究与实现
下一篇:面向癌症代谢系统的建模及应用研究