中文摘要 | 第1-5页 |
英文摘要 | 第5-11页 |
1 绪论 | 第11-27页 |
1.1 引言 | 第11-12页 |
1.2 关联规则的基本概念 | 第12-13页 |
1.2.1 基本概念和问题描述 | 第12页 |
1.2.2 关联规则的种类 | 第12-13页 |
1.3 关联规则挖掘的算法 | 第13-23页 |
1.3.1 经典频繁集方法 | 第13-15页 |
1.3.2 频繁集算法的几种优化方法 | 第15-19页 |
1.3.3 其他的频繁集挖掘方法 | 第19-20页 |
1.3.4 多层和多维关联规则的挖掘 | 第20-22页 |
1.3.5 并行关联规则挖掘和分布式关联规则挖掘 | 第22-23页 |
1.4 关联规则价值衡量的方法 | 第23-25页 |
1.4.1 系统客观层面 | 第23-24页 |
1.4.2 用户主观层面 | 第24-25页 |
1.5 本论文的安排及主要工作 | 第25-27页 |
2 分布式关联规则挖掘的基本原理和方法 | 第27-45页 |
2.1 问题的提出 | 第27页 |
2.2 分布式关联规则挖掘的CD算法和DD算法 | 第27-29页 |
2.3 分布式关联规则挖掘的FDM算法 | 第29-32页 |
2.4 FDM算法候选数据集的生成 | 第32-33页 |
2.5 FDM算法候选数据集的局部剪枝 | 第33-36页 |
2.6 FDM算法候选数据集的全局剪枝 | 第36-38页 |
2.7 合计数的轮流检测 | 第38-39页 |
2.8 FDM算法 | 第39-42页 |
2.8.1 候选数据集在宿主结点的生成 | 第40页 |
2.8.2 候选数据集在轮询地址的接收 | 第40-41页 |
2.8.3 候选集由远程结点向轮询结点支持数的返回 | 第41页 |
2.8.4 候选集在轮询地址支持数的接收 | 第41页 |
2.8.5 大数据集在宿主结点的接收 | 第41页 |
2.8.6 两种全局剪枝技术 | 第41-42页 |
2.9 小结 | 第42-45页 |
3 基于星形结构的分布式关联规则挖掘 | 第45-59页 |
3.1 前言 | 第45页 |
3.2 C-DMA的基本思想 | 第45-48页 |
3.2.1 网络结构的讨论 | 第45-47页 |
3.2.2 符号描述 | 第47页 |
3.2.3 C-DMA算法的运行步骤 | 第47-48页 |
3.3 C-DMA关联规则挖掘算法 | 第48-50页 |
3.3.1 C-DMA结点算法 | 第48-49页 |
3.3.2 C-DMA中心结点算法 | 第49-50页 |
3.3.3 C-DMA的全局剪枝策略 | 第50页 |
3.4 C-DMA算法分析 | 第50-52页 |
3.4.1 算法的通讯量复杂度分析 | 第50-51页 |
3.4.2 算法的并行代价分析 | 第51页 |
3.4.3 算法的加速比分析 | 第51页 |
3.4.4 算法的并行伸缩性分析 | 第51-52页 |
3.5 C-DMA的仿真试验 | 第52-56页 |
3.6 树型结构的关联规则分布式挖掘算法 | 第56-58页 |
3.6.1 树型网络的结构 | 第56-57页 |
3.6.2 树型网络环境下关联规则的挖掘原理 | 第57-58页 |
3.7 小结 | 第58-59页 |
4 数量型关联规则 | 第59-69页 |
4.1 引言 | 第59-60页 |
4.2 模糊聚类与FCM算法 | 第60-62页 |
4.3 FCM算法的改进 | 第62-63页 |
4.4 用遗传算法进行FCM聚类 | 第63-65页 |
4.5 数量关联规则到布尔关联规则的转换 | 第65-66页 |
4.6 小结 | 第66-69页 |
5 分布式挖掘多层关联规则 | 第69-81页 |
5.1 前言 | 第69页 |
5.2 项目的概念分层 | 第69-70页 |
5.3 单数据库多层关联规则挖掘方法 | 第70-72页 |
5.3.1 基本原理 | 第70-71页 |
5.3.2 SMAM算法描述 | 第71-72页 |
5.4 分布式多层关联规则的问题定义 | 第72-73页 |
5.5 分布式挖掘多层关联规则的相关技术 | 第73-75页 |
5.5.1 修剪编码交易表 | 第73-74页 |
5.5.2 产生候选集 | 第74-75页 |
5.5.3 候选集剪枝 | 第75页 |
5.6 分布式多层关联规则的挖掘算法 | 第75-77页 |
5.6.1 DMAM-LP算法 | 第75-77页 |
5.6.2 DMAM-LUP算法 | 第77页 |
5.6.3 DMAM-LPP算法 | 第77页 |
5.7 算法仿真 | 第77-80页 |
5.8 小结 | 第80-81页 |
6 基于抽样的分布式关联规则挖掘 | 第81-91页 |
6.1 引言 | 第81页 |
6.2 相关技术 | 第81-85页 |
6.2.1 抽样方法 | 第81-83页 |
6.2.2 提高挖掘结果精度的策略 | 第83-85页 |
6.3 分布式元学习方法的原理 | 第85-86页 |
6.3.1 串行计数 | 第85页 |
6.3.2 分组并行计数 | 第85-86页 |
6.4 分布式元学习算法 | 第86-88页 |
6.4.1 算法SMDA | 第87页 |
6.4.2 SMDA-PC算法 | 第87-88页 |
6.4.3 算法SMDA_BPC | 第88页 |
6.5 与其它算法进行比较 | 第88-89页 |
6.5.1 SMDA和典型的分布式算法FDM的比较 | 第88-89页 |
6.5.2 SMDA和抽样算法Sampling的比较 | 第89页 |
6.6 小结 | 第89-91页 |
7 关联规则挖掘的兴趣度研究 | 第91-99页 |
7.1 兴趣度研究的意义 | 第91页 |
7.2 客观兴趣度 | 第91-93页 |
7.2.1 基本评价准则 | 第91-92页 |
7.2.2 粗度量方法 | 第92页 |
7.2.3 细度量方法 | 第92-93页 |
7.3 主观兴趣度 | 第93-94页 |
7.3.1 基本评价标准 | 第93页 |
7.3.2 用户对关联规则进行兴趣度分析 | 第93-94页 |
7.4 关联规则相似性兴趣度的研究 | 第94-97页 |
7.4.1 Klemettinen的模板理论 | 第95页 |
7.4.2 基于相似性的关联规则启发式方法 | 第95-97页 |
7.5 相似性计算与模板相结合的策略 | 第97-98页 |
7.6 小结 | 第98-99页 |
8 本文总结和今后的工作 | 第99-101页 |
8.1 本文总结 | 第99页 |
8.2 今后的工作 | 第99-101页 |
致谢 | 第101-103页 |
参考文献 | 第103-110页 |
附录1.王越在攻读博士学位期间发表的论文目录 | 第110-111页 |
2.王越在攻读博士学位期间参加的科研项目 | 第111页 |