首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

海量数据的预处理及其大规模SVM分类算法研究

摘要第4-5页
ABSTRACT第5页
第一章 绪论第8-11页
    1.1 研究背景第8-9页
    1.2 研究意义第9-10页
    1.3 论文结构第10-11页
第二章 分布式处理平台与技术第11-21页
    2.1 分布式计算架构Spark第11-15页
        2.1.1 Spark概述第11-12页
        2.1.2 Spark架构第12-13页
        2.1.3 Spark核心概念第13-15页
    2.2 分布式实时计算系统Storm第15-19页
        2.2.1 Storm概述第15-16页
        2.2.2 Storm架构第16-17页
        2.2.3 Storm核心概念第17-19页
    2.3 基于分布式计算平台的机器学习工具第19-21页
第三章 流式计数算法第21-41页
    3.1 问题定义第21-22页
    3.2 常见频繁项算法第22-24页
        3.2.1 Counter-based方法第22页
        3.2.2 Sketch-based方法第22-23页
        3.2.3 Space Saving算法第23-24页
    3.3 Space Saving并行化设计第24-28页
        3.3.1 本地节点第26-27页
        3.3.2 全局节点第27-28页
    3.4 并行算法误差分析第28-31页
    3.5 设计的改进第31-32页
    3.6 并行算法性能测试第32-39页
        3.6.1 数据倾斜度第32-36页
        3.6.2 计数器个数第36-37页
        3.6.3 节点机器个数第37-38页
        3.6.4 发送阈值第38-39页
    3.7 本章小结第39-41页
第四章 并行非线性支持向量机第41-64页
    4.1 基本原理第41-45页
        4.1.1 线性支持向量机第41-42页
        4.1.2 引入松弛变量的支持向量机第42-43页
        4.1.3 非线性支持向量机第43-45页
    4.2 支持向量机优化问题第45-48页
        4.2.1 有效集法第45-46页
        4.2.2 序列最小优化算法(SMO)第46-47页
        4.2.3 内点法(IPM)第47-48页
    4.3 primal-dual内点法第48-52页
        4.3.1 优化方向第49-50页
        4.3.2 线性查找第50-51页
        4.3.3 终止条件第51-52页
    4.4 基于Spark的支持向量机实现第52-61页
        4.4.1 系统设计第52-54页
        4.4.2 并行不完全乔利斯基分解实现第54-56页
        4.4.3 程序优化第56-59页
        4.4.4 非线性表达能力第59-60页
        4.4.5 分类准确率第60-61页
    4.5 算法可扩展性测试第61-63页
    4.6 本章小结第63-64页
第五章 总结与展望第64-66页
参考文献第66-69页
致谢第69-70页
攻读学位期间发表的学术论文目录第70页

论文共70页,点击 下载论文
上一篇:SDN平台下基于多维度QoE模型的无线资源分配算法研究
下一篇:流式计算模式的性能研究与优化