摘要 | 第1-7页 |
Abstract | 第7-12页 |
主要符号对照表 | 第12-13页 |
第1章 绪论 | 第13-25页 |
·数据挖掘概述 | 第13-21页 |
·数据挖掘的产生 | 第13页 |
·数据挖掘的概念 | 第13-15页 |
·知识发现基本过程 | 第15页 |
·KDD常用处理过程模型 | 第15-18页 |
·数据挖掘的任务与应用 | 第18-19页 |
·数据挖掘的特点 | 第19-20页 |
·数据挖掘的主要挑战 | 第20-21页 |
·选题背景及意义 | 第21-23页 |
·论文的主要研究内容及创新点 | 第23-24页 |
·论文的组织结构 | 第24-25页 |
第2章 加权频繁遍历模式挖掘概述 | 第25-41页 |
·频繁模式挖掘 | 第25-29页 |
·关联规则挖掘相关概念 | 第25-27页 |
·频繁模式挖掘定义及算法类型 | 第27-29页 |
·加权频繁模式挖掘概述 | 第29-31页 |
·约束频繁模式挖掘 | 第29-30页 |
·加权频繁模式挖掘 | 第30-31页 |
·基于加权有向图的频繁遍历模式挖掘 | 第31-40页 |
·问题的提出 | 第31-32页 |
·加权有向图模型 | 第32-34页 |
·遍历访问模式种类 | 第34-35页 |
·两类加权有向图的转换 | 第35-40页 |
·本章小结 | 第40-41页 |
第3章 利用加权模式可拓展性有效挖掘加权频繁遍历模式 | 第41-63页 |
·引言 | 第41-42页 |
·基本知识和相关定义 | 第42-43页 |
·从加权有向图中挖掘频繁遍历模式 | 第43-50页 |
·剪枝策略 | 第43-47页 |
·两种剪枝算法的复杂度分析 | 第47页 |
·候选模式集产生策略 | 第47-49页 |
·加权频繁遍历模式挖掘算法WFTPMiner | 第49-50页 |
·支持度/权值界评价方法 | 第50-54页 |
·通过图的全局拓扑结构计算l-支持度界或l-权值界——方法EGTG | 第50-51页 |
·用EGTG法挖掘加权频繁遍历模式实例分析 | 第51-52页 |
·通过图的局部拓扑结构计算l-支持度界或l-权值界——方法ELTG | 第52-53页 |
·用ELTG法挖掘加权频繁遍历模式实例分析 | 第53-54页 |
·实验与性能分析 | 第54-61页 |
·生成合成数据集 | 第55-57页 |
·两种支持度界/权值界评估方法的有效性比较 | 第57-59页 |
·算法可伸缩性研究 | 第59-60页 |
·算法正确性研究 | 第60-61页 |
·本章小结 | 第61-63页 |
第4章 基于加权FP-tree的加权频繁遍历模式挖掘算法 | 第63-83页 |
·引言 | 第63-64页 |
·问题表述 | 第64-68页 |
·相关定义 | 第64页 |
·修订加权支持度 | 第64-65页 |
·频繁模式的闭合性与加权性约束的结合顺序 | 第65-68页 |
·利用加权FP-tree挖掘闭合加权频繁遍历模式 | 第68-75页 |
·构建加权FP-tree | 第68-69页 |
·搜索空间剪枝策略及必要检查 | 第69-71页 |
·自底向上、分而治之挖掘加权FP-tree | 第71-73页 |
·闭合加权频繁遍历模式挖掘算法CWFTPMiner | 第73-75页 |
·利用加权FP-tree挖掘最大加权频繁遍历模式 | 第75-79页 |
·搜索空间剪枝策略 | 第76-77页 |
·使用分而治之策略自底向上挖掘加权FP-tree | 第77页 |
·基于WDG的最大频繁模式挖掘算法 | 第77-79页 |
·实验评估 | 第79-82页 |
·生成合成数据集 | 第79-80页 |
·算法CWFTPMiner与算法FPclose有效性和可伸缩性比较 | 第80-81页 |
·算法WTMaxMiner与算法FPmax有效性和可伸缩性比较 | 第81-82页 |
·本章小结 | 第82-83页 |
第5章 一种有效的基于图遍历的加权频繁序列模式挖掘算法 | 第83-99页 |
·引言 | 第83-84页 |
·问题表述 | 第84-87页 |
·基本知识和相关定义 | 第84-87页 |
·修正遍历序列加权支持度 | 第87页 |
·利用加权投影模式增长方法从WDG遍历中挖掘WFTSP | 第87-94页 |
·从简单遍历序列数据库中挖掘WFTSP | 第90-91页 |
·从复杂遍历序列数据库中挖掘WFTSP | 第91-94页 |
·实验评估 | 第94-98页 |
·生成合成数据集 | 第95页 |
·简单遍历序列事务数据库实验结果 | 第95-97页 |
·复杂遍历序列事务数据库实验结果 | 第97-98页 |
·本章小结 | 第98-99页 |
第6章 利用统计理论有效挖掘带有噪声数据的整体加权频繁遍历模式 | 第99-107页 |
·引言 | 第99页 |
·问题表述 | 第99-101页 |
·基本知识 | 第99-100页 |
·相关定义 | 第100-101页 |
·基于统计理论的加权频繁遍历模式挖掘方法—SWFTPMiner | 第101-104页 |
·修订加权TTDB和VWDG | 第101-102页 |
·运用逐层策略挖掘加权频繁模式 | 第102-103页 |
·利用加权FP-tree分而治之策略挖掘加权频繁模式 | 第103-104页 |
·其他整体加权频繁模式挖掘方法 | 第104页 |
·实验评估 | 第104-106页 |
·实验环境与数据集合成 | 第104-105页 |
·置信度考虑与否对算法的性能影响测试 | 第105页 |
·算法有效性测试 | 第105-106页 |
·算法可伸缩性测试 | 第106页 |
·本章小结 | 第106-107页 |
第7章 WHFPMiner:利用加权FP-tree模式增长算法有效挖掘加权强相关频繁模式 | 第107-117页 |
·引言 | 第107-108页 |
·问题表述 | 第108-111页 |
·基本知识 | 第108页 |
·相关定义 | 第108-109页 |
·加权h置信度的反单调性和交叉加权支持度性 | 第109-111页 |
·挖掘具有强相关性的加权频繁模式 | 第111-114页 |
·构建加权FP-tree | 第111-112页 |
·加权强相关频繁模式挖掘算法WHFPMiner | 第112-113页 |
·搜索空间剪枝策略 | 第113页 |
·运用分而治之策略,自底向上遍历挖掘全局加权FP-tree | 第113-114页 |
·实验评估 | 第114-116页 |
·实验环境和数据集 | 第115页 |
·实验结果及分析 | 第115-116页 |
·本章小结 | 第116-117页 |
第8章 总结与展望 | 第117-120页 |
·本文工作 | 第117-119页 |
·进一步工作 | 第119-120页 |
致谢 | 第120-121页 |
参考文献 | 第121-132页 |
附录A:算法索引 | 第132-133页 |
附录B:插图索引 | 第133-135页 |
附录C:表格索引 | 第135-136页 |
附录D:作者在攻读博士学位期间发表的论文及参与科研情况 | 第136-137页 |
1.论文情况(已发表和录用) | 第136-137页 |
2.参与和合作的科研项目 | 第137页 |