高频繁度低效用模式挖掘算法及其在云计算下的实现研究

摘要	第2-4页
ABSTRACT	第4-6页
1 绪论	第9-16页
1.1 论文研究背景和意义	第9-11页
1.2 国内外研究现状和发展趋势	第11-13页
1.3 本文的研究内容与主要贡献	第13-14页
1.3.1 主要研究内容	第13页
1.3.2 主要贡献	第13-14页
1.4 论文组织结构	第14-16页
2 高频繁度低效用模式挖掘问题及相关定义	第16-18页
3 相关工作	第18-23页
3.1 频繁模式挖掘算法	第18页
3.2 效用模式挖掘算法	第18-20页
3.3 分布式并行模式挖掘算法	第20-22页
3.4 本章小结	第22-23页
4 分布式并行计算框架MapReduce和Spark	第23-30页
4.1 分布式并行计算框架MapReduce	第23-24页
4.2 分布式并行计算框架Spark	第24-28页
4.3 MapReduce与Spark的对比	第28-29页
4.4 本章小结	第29-30页
5 高频繁度低效用模式挖掘算法HFLUP	第30-43页
5.1 高频繁度低效用模式挖掘基础算法HFLUP_(Base)	第30-38页
5.1.1 搜索空间	第30-31页
5.1.2 数据结构	第31-35页
5.1.3 从FULs中直接挖掘出高频繁度低效用模式	第35-38页
5.2 高频繁度低效用模式挖掘基础算法HFLUP以及高效的策略	第38-42页
5.2.1 通过效用下界减少搜索空间	第38-41页
5.2.2 通过lookahead避免枚举	第41-42页
5.3 本章小结	第42-43页
6 基于Spark的并行高频繁度低效用模式挖掘算法PHFLUPS	第43-51页
6.1 算法第一阶段	第44-45页
6.2 算法第二阶段	第45-47页
6.3 算法第三阶段	第47-50页
6.4 本章小结	第50-51页
7 实验分析	第51-64页
7.1 实验环境和数据集	第51-52页
7.2 单机高频繁度低效用模式挖掘算法评估比较	第52-59页
7.2.1 分析效用下界裁剪策略和lookahead策略	第53-56页
7.2.2 运行时间和内存使用	第56-59页
7.3 并行高频繁度低效用模式挖掘算法评估比较	第59-63页
7.3.1 速度性能分析	第60-62页
7.3.2 可伸缩性性能分析	第62-63页
7.4 本章小结	第63-64页
8 总结与展望	第64-66页
8.1 论文总结	第64-65页
8.2 未来展望	第65-66页
参考文献	第66-70页
本文作者硕士期间参加的科研项目及学术成果	第70-71页
致谢	第71-72页