首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的频繁浏览模式挖掘系统的设计与实现

摘要第4-5页
Abstract第5页
第一章 绪论第8-13页
    1.1 研究背景第8-9页
    1.2 研究现状第9-10页
        1.2.1 频繁模式挖掘算法的研究现状第9页
        1.2.2 分布式环境下频繁模式挖掘算法研究现状第9-10页
    1.3 研究目标与内容第10-11页
    1.4 论文组织结构第11-13页
第二章 相关技术与研究第13-24页
    2.1 Web日志挖掘第13-16页
        2.1.1 Web挖掘分类第13-14页
        2.1.2 Web使用挖掘第14-16页
    2.2 分布式平台相关技术基础第16-23页
        2.2.1 Hadoop分布式计算平台第16-19页
        2.2.2 Spark分布式计算平台第19-22页
        2.2.3 Hadoop与Spark的关系和特性第22-23页
    2.3 本章小结第23-24页
第三章 浏览行为的集合频繁模式分布式挖掘第24-35页
    3.1 引言第24页
    3.2 浏览行为的集合频繁模式挖掘的挑战第24-25页
    3.3 负载均衡的可扩展FP-Growth分布式算法第25-30页
        3.3.1 负载量估计和均衡分组第25-28页
        3.3.2 基于负载均衡分组的会话序列数据库切分第28-30页
    3.4 基于Spark的FP-Growth负载均衡分布式算法的实现第30-34页
    3.5 本章小结第34-35页
第四章 浏览行为的序列频繁模式分布式挖掘第35-48页
    4.1 引言第35页
    4.2 浏览行为的序列频繁模式挖掘的挑战第35-36页
    4.3 AprioriAll算法的候选序列的生成方式第36-38页
        4.3.1 基于频繁k序列自连接的候选序列生成方式第36-37页
        4.3.2 基于PairWise的候选序列生成方式第37-38页
        4.3.3 两种候选序列生成方式的时空效率对比分析第38页
    4.4 可扩展的AprioriAll分布式算法第38-45页
        4.4.1 AprioriAll分布式算法分析第39-40页
        4.4.2 基于Spark的可扩展AprioriAll分布式算法第40-45页
    4.5 浏览行为的正则频繁模式挖掘分布式挖掘第45-46页
    4.6 本章小结第46-48页
第五章 系统原型设计与实验分析第48-59页
    5.1 引言第48页
    5.2 系统需求分析第48页
    5.3 系统设计第48-52页
        5.3.1 系统功能设计第48-49页
        5.3.2 日志数据预处理第49-52页
    5.4 系统性能测试第52-58页
        5.4.1 实验测试方法第52-53页
        5.4.2 算法准确性测试第53页
        5.4.3 算法速度性能测试第53-55页
        5.4.4 算法扩展性测试第55-58页
    5.5 本章小结第58-59页
第六章 总结和展望第59-60页
致谢第60-61页
作者简介第61-62页
参考文献第62-64页

论文共64页,点击 下载论文
上一篇:基于虚拟现实技术的智能视频监控系统的实现
下一篇:基于雷达和机器视觉的前车检测预警技术研究