摘要 | 第8-10页 |
Abstract | 第10-13页 |
第一章 绪论 | 第14-29页 |
1.1 研究背景与意义 | 第14-17页 |
1.2 相关工作 | 第17-24页 |
1.2.1 传统频繁项集挖掘 | 第18-20页 |
1.2.2 频繁闭项集挖掘 | 第20-22页 |
1.2.3 最大频繁项集挖掘 | 第22页 |
1.2.4 Top-k频繁模式挖掘 | 第22-23页 |
1.2.5 近似频繁模式挖掘 | 第23-24页 |
1.3 研究内容与本文贡献 | 第24-27页 |
1.3.1 研究内容 | 第24-26页 |
1.3.2 本文贡献 | 第26-27页 |
1.4 论文结构 | 第27-29页 |
第二章 Eclat框架下基于支持度的双向排序策略 | 第29-55页 |
2.1 基于垂直数据格式的Eclat算法 | 第29-32页 |
2.1.1 存在的问题 | 第29-30页 |
2.1.2 支持度性质及证明 | 第30-32页 |
2.2 基于支持度排序的双向处理策略 | 第32-37页 |
2.2.1 支持度升序排列阶段 | 第32-33页 |
2.2.2 支持度降序排列阶段 | 第33-34页 |
2.2.3 频繁项集挖掘中的双向处理策略 | 第34页 |
2.2.4 Bi-Eclat算法 | 第34-35页 |
2.2.5 Bi-Eclat算法示例 | 第35-37页 |
2.3 概率频繁模式挖掘中的双向排序策略 | 第37-45页 |
2.3.1 数据不确定性的原因 | 第37-38页 |
2.3.2 基于概率数据的不确定数据模型 | 第38-40页 |
2.3.3 概率频繁模式挖掘算法 | 第40-43页 |
2.3.4 概率频繁模式挖掘中的双向排序策略 | 第43-45页 |
2.4 实验结果及分析 | 第45-54页 |
2.4.1 实验数据集 | 第45-47页 |
2.4.2 实验结果分析 | 第47-54页 |
2.5 本章小结 | 第54-55页 |
第三章 Eclat框架下的概率频繁模式挖掘算法 | 第55-74页 |
3.1 重要理论和概念 | 第55-58页 |
3.1.1 可能性世界理论 | 第55-56页 |
3.1.2 概率频繁模式挖掘相关概念 | 第56-58页 |
3.2 概率频繁项集精确挖掘算法 | 第58-64页 |
3.2.1 相关工作 | 第58-60页 |
3.2.2 Tidlist数据结构 | 第60页 |
3.2.3 概率频度计算模块 | 第60-62页 |
3.2.4 UBEclat算法 | 第62-64页 |
3.3 概率频繁项集近似挖掘算法 | 第64-68页 |
3.3.1 近似挖掘理论基础 | 第64-65页 |
3.3.2 近似挖掘相关工作 | 第65-67页 |
3.3.3 NDUEclat算法 | 第67-68页 |
3.4 实验结果及分析 | 第68-73页 |
3.4.1 实验数据集 | 第68-69页 |
3.4.2 正态分布数据集中的性能分析 | 第69-70页 |
3.4.3 长尾分布数据集中的性能分析 | 第70-73页 |
3.5 本章小结 | 第73-74页 |
第四章 基于粗糙集理论的近似频繁模式挖掘 | 第74-95页 |
4.1 容错数据中的频繁模式挖掘理论 | 第74-79页 |
4.1.1 容错数据模型 | 第74页 |
4.1.2 容错数据的挑战 | 第74-76页 |
4.1.3 粗糙集理论在数据挖掘中的应用 | 第76-78页 |
4.1.4 粗糙集理论及相关概念 | 第78-79页 |
4.2 基于粗糙集理论的近似频繁模式挖掘 | 第79-88页 |
4.2.1 事务信息系统构建阶段 | 第80-81页 |
4.2.2 等价类生成阶段 | 第81-83页 |
4.2.3 上近似和下近似的定义 | 第83-84页 |
4.2.4 近似频繁模式挖掘阶段 | 第84-86页 |
4.2.5 精确度和覆盖度的定义 | 第86-88页 |
4.3 实验结果及分析 | 第88-93页 |
4.3.1 模拟数据集上的性能分析 | 第88-90页 |
4.3.2 真实数据集上的性能分析 | 第90-93页 |
4.4 本章小结 | 第93-95页 |
第五章 在传统中医药数据集中挖掘Top-k近似频繁闭模式 | 第95-118页 |
5.1 相关工作 | 第95-101页 |
5.1.1 面临的问题 | 第96-97页 |
5.1.2 近似频繁模式挖掘算法 | 第97-101页 |
5.2 基于粗糙集理论的Top-k近似频繁闭模式挖掘 | 第101-110页 |
5.2.1 事务类划分阶段 | 第103-105页 |
5.2.2 核模式产生阶段 | 第105-109页 |
5.2.3 Top-k近似频繁闭模式挖掘阶段 | 第109-110页 |
5.3 实验结果和分析 | 第110-116页 |
5.3.1 基于支持度的聚类算法性能分析 | 第110-113页 |
5.3.2 Top-k近似频繁闭模式挖掘算法性能分析 | 第113-116页 |
5.3.3 实验结果分析 | 第116页 |
5.4 本章小结 | 第116-118页 |
第六章 总结和展望 | 第118-121页 |
6.1 本文总结 | 第118-119页 |
6.2 研究展望 | 第119-121页 |
参考文献 | 第121-137页 |
攻读博士学位期间发表录用部分学术论文 | 第137-138页 |
攻读博士学位期间参与项目及获奖情况 | 第138-139页 |
致谢 | 第139-140页 |