首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的高效用项集挖掘算法研究

摘要第4-6页
ABSTRACT第6-7页
1 绪论第10-16页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-13页
        1.2.1 关联规则的研究现状第11-13页
        1.2.2 高效用项集挖掘的研究现状第13页
    1.3 论文研究内容第13-14页
    1.4 论文结构安排第14-16页
2 相关工作第16-36页
    2.1 问题定义与描述第16-18页
    2.2 d2hup算法第18-23页
    2.3 EFIM算法第23-28页
    2.4 Spark相关技术第28-32页
        2.4.1 Spark架构第29-30页
        2.4.2 Spark生态系统第30-32页
    2.5 相关工具介绍第32-36页
3 基于SPARK的高效用项集挖掘并行化第36-46页
    3.1 基于Spark并行HUIM算法架构第36-37页
    3.2 d2hup算法并行化第37-42页
        3.2.1 基于数据划分的并行d2hup算法第37-40页
        3.2.2 基于树结构划分的并行d2hup算法第40-42页
    3.3 EFIM算法并行化第42-46页
        3.3.1 基于Spark的EFIM算法的设计思想第42-43页
        3.3.2 基于Spark的EFIM算法实现第43-46页
4 实验结果第46-54页
    4.1 实验设计第46页
    4.2 数据集介绍第46-47页
    4.3 实验环境介绍第47页
    4.4 实验结果及分析第47-53页
        4.4.1 partition参数对于算法性能的影响第48-51页
        4.4.2 executors参数对算法性能影响第51页
        4.4.3 executor-cores参数对于算法性能的影响第51-52页
        4.4.4 并行HUIM算法与串行HUIM算法时间对比第52-53页
    4.5 本章小结第53-54页
5 自动选择最优高效用项集挖掘算法第54-60页
    5.1 问题定义第54页
    5.2 算法设计第54-55页
    5.3 实验设计第55-56页
    5.4 实验结果第56-58页
        5.4.1 10折交叉验证结果第56-57页
        5.4.2 Cross-dataSet实验结果第57-58页
    5.5 本章小结第58-60页
6 总结与展望第60-62页
    6.1 总结第60页
    6.2 展望第60-62页
参考文献第62-65页
致谢第65-66页

论文共66页,点击 下载论文
上一篇:基于内容的发布订阅系统匹配算法研究
下一篇:基于云模型的概念格分粒及可视化研究