关联规则挖掘算法在大数据集上的应用研究
摘要 | 第1-4页 |
Abstract | 第4-7页 |
第一章 绪论 | 第7-11页 |
·课题的研究背景及意义 | 第7-8页 |
·国内外研究现状 | 第8-9页 |
·本文所做的工作 | 第9页 |
·本文的组织结构 | 第9-10页 |
·小结 | 第10-11页 |
第二章 关联规则挖掘算法 | 第11-19页 |
·关联规则挖掘概念 | 第11-12页 |
·关联规则的种类 | 第12-13页 |
·经典关联规则挖掘算法--Apriori | 第13-15页 |
·Apriori 算法的挖掘步骤 | 第13页 |
·Apriori 算法性质 | 第13页 |
·Apriori 算法的关键步骤 | 第13-14页 |
·Apriori 算法 | 第14-15页 |
·Apriori 算法的评价 | 第15页 |
·Apriori 算法的改进 | 第15-18页 |
·基于散列技术 | 第15-16页 |
·基于事务压缩方法 | 第16-18页 |
·基于划分的方法 | 第18页 |
·基于采样方法 | 第18页 |
·动态项集计数 | 第18页 |
·小结 | 第18-19页 |
第三章 抽样在大数据集挖掘中的应用 | 第19-31页 |
·抽样概述 | 第19-20页 |
·抽样 | 第19页 |
·抽样的优点 | 第19页 |
·基本抽样方法 | 第19-20页 |
·抽样在关联规则挖掘中的应用 | 第20-30页 |
·一种新的两阶段抽样算法 | 第21-22页 |
·关联规则的序贯抽样算法 | 第22-27页 |
·基于负边界的抽样算法 | 第27-28页 |
·分布式抽样算法 | 第28-30页 |
·小结 | 第30-31页 |
第四章 大数据集挖掘的层次二分抽样算法 | 第31-43页 |
·问题的提出 | 第31-32页 |
·相关定义 | 第32页 |
·随机抽样方法 | 第32-34页 |
·随机抽取比较法 | 第32-33页 |
·随机抽取交换法 | 第33页 |
·随机抽取交换法的改进 | 第33-34页 |
·改进的层次二分算法(EHAC 算法) | 第34-42页 |
·算法基本思想 | 第34-35页 |
·算法描述 | 第35-37页 |
·算法实现 | 第37-38页 |
·实验结果及分析 | 第38-42页 |
·小结 | 第42-43页 |
第五章 客户机/服务器模式并行关联规则挖掘的研究 | 第43-56页 |
·问题的提出 | 第43页 |
·相关定义 | 第43-44页 |
·经典并行算法 | 第44-45页 |
·CD 算法 | 第44-45页 |
·DD 算法 | 第45页 |
·客户机/服务器模式的并行关联规则挖掘 | 第45-54页 |
·算法基本思想 | 第46-47页 |
·算法结构模型 | 第47页 |
·算法实现 | 第47-49页 |
·实验及结果分析 | 第49-54页 |
·小结 | 第54-56页 |
第六章 总结与展望 | 第56-58页 |
·总结 | 第56-57页 |
·未来工作 | 第57-58页 |
致谢 | 第58-59页 |
参考文献 | 第59-64页 |
附录:作者在攻读硕士学位期间发表的论文 | 第64页 |