中文摘要 | 第1-9页 |
英文摘要 | 第9-11页 |
第一章 引言 | 第11-18页 |
1. 1 数据挖掘的基本背景 | 第11-16页 |
1. 2 论文的目标和结构 | 第16-18页 |
1. 2. 1 论文的工作 | 第16页 |
1. 2. 2 论文的组织结构 | 第16-18页 |
第二章 关联规则概述 | 第18-25页 |
2. 1 关联规则挖掘的基本概念 | 第18-21页 |
2. 1. 1 关联规则的定义 | 第18-20页 |
2. 1. 2 关联规则的基本挖掘算法 | 第20-21页 |
2. 2 关联规则研究的现状 | 第21-24页 |
2. 2. 1 封闭项集的处理 | 第22-23页 |
2. 2. 2 约束的处理 | 第23-24页 |
2. 2. 3 应用的拓展 | 第24页 |
2. 3 小结 | 第24-25页 |
第三章 兴趣度与关联规则 | 第25-45页 |
3. 1 兴趣度的引入 | 第25-29页 |
3. 1. 1 从基本定义到含负项的定义 | 第25-27页 |
3. 1. 2 对定义的一些改进 | 第27-29页 |
3. 2 含负项的关联规则产生算法 | 第29-36页 |
3. 2. 1 基于兴趣度的关联规则生成算法 | 第29-33页 |
3. 2. 2 算法的特点 | 第33-34页 |
3. 2. 3 实验结果分析 | 第34-36页 |
3. 3 基于关联规则的数据挖掘工具ARMiner | 第36-44页 |
3. 3. 1 系统概述 | 第36-38页 |
3. 3. 2 ARMiner系统的功能 | 第38-40页 |
3. 3. 3 ARMiner系统的应用 | 第40-42页 |
3. 3. 4 相关系统讨论 | 第42-44页 |
3. 4 小结 | 第44-45页 |
第四章 生成唯一标号图的频繁模式 | 第45-72页 |
4. 1 问题的引出 | 第45-46页 |
4. 2 唯一标号图分析的基本概念 | 第46-48页 |
4. 3 基于Apriori思想的Matricon算法 | 第48-55页 |
4. 3. 1 Matricon算法的基本概念和思想 | 第48-51页 |
4. 3. 2 Matricon算法描述和实现 | 第51-55页 |
4. 4 基于FP Growth思想的SFP算法 | 第55-61页 |
4. 4. 1 SFP树的构建 | 第56页 |
4. 4. 2 从SFP树中获得连通频繁图 | 第56-61页 |
4. 5 Matricon和SFP算法性能分析和比较 | 第61-65页 |
4. 5. 1 测试数据的生成 | 第62页 |
4. 5. 2 Matricon和SFP算法性能的比较分析 | 第62-63页 |
4. 5. 3 SFP算法性能分析 | 第63-65页 |
4. 6 利用频繁模式发现权威Web资源 | 第65-71页 |
4. 7 小结 | 第71-72页 |
第五章 有序标号树的频繁模式 | 第72-98页 |
5. 1 相关工作 | 第73页 |
5. 2 问题的描述 | 第73-75页 |
5. 3 发现典型结构的Chopper算法 | 第75-81页 |
5. 3. 1 算法的基本思想 | 第75-78页 |
5. 3. 2 寻找频繁序列 | 第78-80页 |
5. 3. 3 寻找典型结构 | 第80-81页 |
5. 4 Chopper算法性能分析 | 第81-84页 |
5. 4. 1 测试数据 | 第82页 |
5. 4. 2 性能评估 | 第82-84页 |
5. 4. 3 性能比较 | 第84页 |
5. 5 发现频繁结构的XSpanner算法 | 第84-91页 |
5. 5. 1 从典型结构到频繁结构 | 第84-86页 |
5. 5. 2 XSpanner算法 | 第86-91页 |
5. 6 XSpanner算法性能分析 | 第91-94页 |
5. 6. 1 测试数据 | 第91-92页 |
5. 6. 2 性能分析 | 第92-94页 |
5. 7 现实世界中的应用 | 第94-97页 |
5. 8 小结 | 第97-98页 |
第六章 广义标号图的频繁模式挖掘 | 第98-126页 |
6. 1 基本概念和术语 | 第98-103页 |
6. 1. 1 从唯一标号图到广义标号图 | 第98-100页 |
6. 1. 2 图的同构 | 第100-103页 |
6. 2 基于Apriori思想的频繁子结构分析 | 第103-113页 |
6. 2. 1 以顶点为基准的AcGM算法 | 第104-108页 |
6. 2. 2 以边为基准的FSG算法 | 第108-111页 |
6. 2. 3 AcGM vs.FSG | 第111-113页 |
6. 3 以性能为目标的综合改进 | 第113-117页 |
6. 3. 1 利用同分异构原理对搜索空间的进一步限制 | 第113-115页 |
6. 3. 2 利用顶点格提高同构判定的性能 | 第115-116页 |
6. 3. 3 利用TID和集合运算减小子图同构判定的范围 | 第116-117页 |
6. 4 快速频繁标号图挖掘算法Topology | 第117-120页 |
6. 5 Topology算法性能分析 | 第120-123页 |
6. 5. 1 测试数据 | 第120-121页 |
6. 5. 2 性能评估 | 第121-123页 |
6. 6 利用Topology算法对化学分子进行分析 | 第123-124页 |
6. 7 相关工作 | 第124-125页 |
6. 8 小结 | 第125-126页 |
第七章 结论与展望 | 第126-130页 |
7. 1 深度拓展 | 第126-127页 |
7. 1. 1 从正到反:观察视角的转换 | 第126页 |
7. 1. 2 从项到图:操作对象的变迁 | 第126-127页 |
7. 2 主要结论 | 第127-128页 |
7. 3 今后工作 | 第128-129页 |
7. 4 小结 | 第129-130页 |
参考文献 | 第130-143页 |
致谢 | 第143-144页 |
附录A 攻读博士学位期间科研工作 | 第144-146页 |
A.1 发表论文 | 第144-145页 |
A.1. 1 期刊论文 | 第144页 |
A.1. 2 会议论文 | 第144-145页 |
A.2 参加项目 | 第145-146页 |