首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于SPARK技术的网络虚拟身份数据挖掘

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第10-15页
    1.1 研究背景第10-11页
    1.2 研究意义第11-12页
    1.3 研究现状第12-13页
    1.4 论文结构第13-15页
第二章 相关理论基础第15-27页
    2.1 Spark简介第15-22页
        2.1.1 Spark和Hadoop第15页
        2.1.2 Spark的体系架构第15-16页
        2.1.3 弹性分布式数据集RDD第16-17页
        2.1.4 Spark特性第17页
        2.1.5 Spark任务执行流程第17-21页
        2.1.6 Spark的生态系统第21-22页
    2.2 虚拟身份的数据挖掘第22-24页
        2.2.1 分类任务第22-23页
        2.2.2 聚类任务第23页
        2.2.3 孤立点分析第23-24页
    2.3 朴素贝叶斯方法第24-26页
        2.3.1 朴素贝叶斯方法定义和原理第24页
        2.3.2 贝叶斯模型概述第24页
        2.3.3 学习(参数估计)第24-25页
        2.3.4 分类第25页
        2.3.5 拉普拉斯平滑第25-26页
    2.4 本章小结第26-27页
第三章 网络虚拟身份数据挖掘系统架构第27-35页
    3.1 网络虚拟身份数据挖掘系统简介第27页
    3.2 网络虚拟身份数据挖采集模块第27-29页
    3.3 数据预处理模块第29-33页
        3.3.1 采集数据存储到HDFS第29-31页
        3.3.2 同一用户的不同虚拟身份合并第31-33页
    3.4 数据分析模块第33页
    3.5 本章小结第33-35页
第四章 网络虚拟身份数据挖掘算法实现第35-54页
    4.1 概述第35页
    4.2 虚拟身份数据采集第35-36页
    4.3 输入数据前期处理第36-40页
        4.3.1 去除无用的数据字段第36-37页
        4.3.2 虚拟身份的轨迹表示方式第37-39页
        4.3.3 虚拟身份轨迹的分类第39-40页
    4.4 马尔可夫链第40-53页
        4.4.1 马尔可夫链与马尔可夫性质第40页
        4.4.2 齐次马尔可夫链和k阶马尔可夫转移概率第40-41页
        4.4.3 利用马尔可夫链进行轨迹预测的思路第41-44页
        4.4.4 轨迹预测准确率测试第44-46页
        4.4.5 轨迹预测结果分析第46-53页
    4.5 本章小结第53-54页
第五章 基于Spark改进贝叶斯方法轨迹预测第54-67页
    5.1 改进贝叶斯方法轨迹预测概述第54-55页
    5.2 输入数据前期处理第55-57页
    5.3 改进贝叶斯方法轨迹预测的算法描述第57-61页
        5.3.1 基于朴素贝叶斯推理方法的轨迹预测第57-58页
        5.3.2 基于改进贝叶斯方法的轨迹预测原理第58页
        5.3.3 原始马尔可夫模型的构造第58-60页
        5.3.4 长轨迹分解子轨迹第60-61页
        5.3.5 计算先验概率第61页
    5.4 基于Spark平台实现MBI的轨迹预测过程第61-66页
        5.4.1 Spark平台环境第62-63页
        5.4.2 预测结果分析第63-66页
    5.5 本章小结第66-67页
第六章 总结与展望第67-68页
参考文献第68-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:虚拟化环境中基于服务负荷测算和预测的负载均衡方法
下一篇:Web广告图片过滤技术研究与实现