首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向LTR的GBRT优化及其并行化

摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第15-20页
    1.1 研究背景和意义第15页
    1.2 国内外研究现状第15-17页
    1.3 本文的研究内容和主要工作第17-18页
    1.4 本文的组织结构第18-20页
第二章 相关背景知识第20-44页
    2.1 LTR(LEARNING TO RANK)概述第20-25页
        2.1.1 引言第20页
        2.1.2 Learning to Rank的基本流程第20-22页
        2.1.3 Learning to Rank的三种基本方法第22-23页
        2.1.4 Learning to Rank的评价指标第23-25页
    2.2 GBRT(GRADIENT BOOSTING REGRESSION TREE)概述第25-34页
        2.2.1 引言第25页
        2.2.2 集成学习(Ensemble Learning)方法概述第25-27页
        2.2.3 Gradient Boosting框架第27-30页
        2.2.4 树模型概述第30-32页
        2.2.5 GBRT整体训练流程第32-34页
    2.3 密度估计第34-37页
        2.3.1 密度估计简介第34-35页
        2.3.2 核密度估计方法第35-37页
    2.4 大数据计算技术和平台第37-43页
        2.4.1 大数据计算平台概述第37-38页
        2.4.2 Spark技术简介第38-43页
    2.5 本章小结第43-44页
第三章 GBRT算法改进及其并行化第44-58页
    3.1 引言第44页
    3.2 GBRT算法并行化难点第44页
    3.3 基于K-MEANS直方图的优化方案第44-55页
        3.3.1 优化思路概述第44-45页
        3.3.2 决策树构建过程再探讨第45-46页
        3.3.3 K-Means直方图构建第46-50页
        3.3.4 候选分裂点构造第50-51页
        3.3.5 利用核函数密度估计方法第51-54页
        3.3.6 带宽选择第54-55页
    3.4 优化后回归树训练过程描述第55-57页
    3.5 本章小结第57-58页
第四章 基于MPI和SPARK的并行化算法设计与实现第58-83页
    4.1 引言第58页
    4.2 基于MPI的并行化方案第58-64页
        4.2.1 概述第58-59页
        4.2.2 Master端工作流程第59-61页
        4.2.3 Slave端工作流程第61-62页
        4.2.4 复杂度分析第62-64页
    4.3 实验设计及结果分析第64-74页
        4.3.1 实验环境及数据第64-65页
        4.3.2 桶个数对精度的影响第65-67页
        4.3.3 精度对比第67-68页
        4.3.4 可扩展性性能评估第68-71页
        4.3.5 真实应用数据效果评估第71-74页
    4.4 基于SPARK平台的并行化方案第74-79页
        4.4.1 概述第74页
        4.4.2 并行化方案设计第74-79页
    4.5 实验设计及结果分析第79-82页
        4.5.1 实验环境及数据第79-80页
        4.5.2 可扩展性测试第80页
        4.5.3 计算核心可扩展性测试第80-81页
        4.5.4 数据可扩展性测试第81-82页
    4.6 本章小结第82-83页
第五章 总结与展望第83-85页
    5.1 本文小结第83页
    5.2 下一步工作第83-85页
参考文献第85-89页
致谢第89-90页
附录 研究生期间论文发表第90-91页

论文共91页,点击 下载论文
上一篇:基于JSON-RPC协议的可穿戴设备跨平台开发
下一篇:图像中目标事件的逻辑建模及应用