基于Spark的流数据集成分类方法研究及应用

摘要	第8-9页
ABSTRACT	第9-10页
第1章绪论	第11-17页
1.1 研究背景与意义	第11页
1.2 国内外研究历史与现状	第11-14页
1.3 研究要点及结构组织	第14-17页
1.3.1 研究要点	第14-15页
1.3.2 结构组织	第15-17页
第2章相关技术和基本理论	第17-37页
2.1 流数据分类	第17-20页
2.1.1 流数据的定义和特征	第17-18页
2.1.2 流数据类型	第18页
2.1.3 流数据分类	第18-20页
2.2 概念漂移	第20-22页
2.2.1 基本概念	第20页
2.2.2 检测方法	第20-21页
2.2.3 处理方法	第21-22页
2.3 集成学习和集成分类器	第22-27页
2.3.1 集成学习概述	第22-23页
2.3.2 构建差异性基分类器	第23-26页
2.3.3 对分类器结果进行整合	第26-27页
2.4 数据流的集成分类方法	第27-28页
2.5 流数据挖掘相关技术框架	第28-34页
2.5.1 Apache Storm	第28-29页
2.5.2 Spark Streaming	第29-31页
2.5.3 分布式文件系统HDFS	第31-33页
2.5.4 Kafka	第33-34页
2.6 本章小结	第34-37页
第3章基于概念漂移的流数据集成分类算法OC-WE及其并行化..	第37-51页
3.1 流数据集成分类算法OC-WE	第37-41页
3.1.1 问题定义	第37页
3.1.2 提出的方法	第37-40页
3.1.3 实验验证	第40-41页
3.2 OC-WE算法基于Spark的并行化实现	第41-47页
3.2.1 分布式系统架构设计	第42-43页
3.2.2 Hadoop集群部署配置	第43-44页
3.2.3 Spark集群部署	第44-45页
3.2.4 Kafka集群部署	第45页
3.2.5 OC-WE算法的并行化实现	第45-47页
3.3 实验过程及结果分析	第47-50页
3.3.1 并行化OC-WE应用部署	第47-48页
3.3.2 流式数据源	第48-49页
3.3.3 实验结果及分析	第49-50页
3.4 本章小结	第50-51页
第4章并行化OC-WE算法在大规模网络流量分类中的应用	第51-57页
4.1 大规模网络流量在线分类方案	第51-52页
4.2 实验环境过程与结果分析	第52-56页
4.2.1 实验环境	第52-53页
4.2.2 实验数据和预处理	第53-54页
4.2.3 实验结果及分析	第54-56页
4.3 本章小结	第56-57页
第5章总结与展望	第57-59页
参考文献	第59-63页
致谢	第63-65页
在学期间主要科研成果	第65页
一、发表学术论文	第65页
二、其他科研成果	第65页
三、发表专利	第65页
四、参加会议与实习	第65页