首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的高效多数投票提升算法研究

摘要第5-6页
ABSTRACT第6-7页
1 绪论第11-17页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-14页
    1.3 本文研究内容第14-15页
    1.4 文本组织结构第15-17页
2 相关工作第17-31页
    2.1 BOOSTING算法概述第17-19页
    2.2 多数投票(MAJORITY VOTE)概述第19-20页
    2.3 相关技术介绍第20-28页
        2.3.1 Batch Learning介绍第20-21页
        2.3.2 Online Learning介绍第21-22页
        2.3.3 分布式介绍第22页
        2.3.4 Spark概述第22-24页
        2.3.5 HDFS分布式存储文件系统第24-25页
        2.3.6 弹性分布式数据集RDD第25-26页
        2.3.7 数据流挖掘第26页
        2.3.8 Spark Streaming概述第26-28页
        2.3.9 Kafka概述第28页
    2.4 本章小结第28-31页
3 基于SPARK的BBM.SPARK算法设计第31-45页
    3.1 BBM算法第31-35页
    3.2 BBM.SPARK算法第35-36页
    3.3 实验设计第36-38页
        3.3.1 性能度量第36页
        3.3.2 数据集第36-37页
        3.3.3 软硬件配置第37页
        3.3.4 BBM.Spark实验参数设计第37-38页
    3.4 实验结果分析第38-44页
        3.4.1 BBM.Spark和BBM分类性能对比分析第38-39页
        3.4.2 partitions对BBM.Spark性能的影响第39-41页
        3.4.3 num-executors对BBM.Spark性能的影响第41-42页
        3.4.4 executor-cores对BBM.Spark性能的影响第42页
        3.4.5 通信开销:网络中传输的数据量及花费时间第42-44页
        3.4.6 串行BBM算法与BBM.Spark的运行效率对比第44页
    3.5 本章小结第44-45页
4 基于SPARK STREAMING的BBM.STREAMING算法设计第45-59页
    4.1 ONLINE BBM算法第45-46页
    4.2 BBM.STREAMING算法第46-47页
    4.3 实验设计第47-48页
    4.4 实验结果分析第48-57页
        4.4.1 BBM.Streaming和online BBM、VFDT收敛性对比分析第48-49页
        4.4.2 BBM.Streaming和online BBM、VFDT分类性能对比分析第49-50页
        4.4.3 partitions对BBM.Streaming性能的影响第50-52页
        4.4.4 max Rate Per Partition对BBM.Streaming性能的影响第52-54页
        4.4.5 durations对BBM.Streaming性能的影响第54-56页
        4.4.6 BBM.Streaming和online BBM、VFDT运行效率对比分析第56-57页
    4.5 本章小节第57-59页
5 总结及展望第59-61页
    5.1 论文工作回顾第59页
    5.2 未来工作展望第59-61页
参考文献第61-65页
致谢第65-67页
攻读学位期间发表的学术论文第67-68页

论文共68页,点击 下载论文
上一篇:高校教务选课子系统的设计与实现
下一篇:基于机器人视觉的饮料瓶质量检测算法