基于图的数据挖掘算法研究 | 第1-43页 |
摘要 | 第5-9页 |
第一章 引言 | 第9-13页 |
·研究背景 | 第9-10页 |
·研究现状 | 第10-12页 |
·本文的主要工作 | 第12页 |
·论文组织 | 第12-13页 |
第二章 基本概念 | 第13-21页 |
·图的基本概念 | 第13-15页 |
·支持度和频繁度 | 第15-16页 |
·频繁子图挖掘 | 第16-20页 |
·频繁子图挖掘的一般过程 | 第16-18页 |
·频繁子图挖掘需要解决的问题 | 第18-20页 |
·本章小结 | 第20-21页 |
第三章 频繁子图挖掘 | 第21-37页 |
·规范化邻接矩阵CAM(CANONICAL ADJACENCY MATRIX)及其理论 | 第21-26页 |
·CAM TREE | 第26-27页 |
·候选集的产生 | 第27-33页 |
·FSubgraphM-Join算子 | 第28-29页 |
·FSubgraphM-Extension算法 | 第29-30页 |
·次优CAM Tree | 第30-33页 |
·支持度和频繁度计算 | 第33-35页 |
·频繁子图挖掘算法FSUBGRAPHM | 第35-36页 |
·本章小结 | 第36-37页 |
第四章 实验与分析 | 第37-41页 |
·数据预处理 | 第37-38页 |
·实验数据分析 | 第38-39页 |
·关联知识提取 | 第39-41页 |
第五章 总结与展望 | 第41-43页 |
Research on Algorithm of Graph-Based Data Mining | 第43-97页 |
ABSTRACT | 第45-49页 |
1.INTRODUCTION | 第49-55页 |
·BACKGROUND | 第49-51页 |
·STATE OF THE ART OF FREQUENT SUBGRAPH MINING | 第51-53页 |
·OUR CONTRIBUTION | 第53-54页 |
·THE ARCHITECTURE OF THIS THESIS | 第54-55页 |
2.PRELIMINARIES | 第55-65页 |
·GRAPH AND IT'S SUBGRAPHS | 第55-56页 |
·SUPPORT AND FREQUENT | 第56-58页 |
·FREQUENT SUBGRAPH MINING | 第58-62页 |
·The general process of frequent subgraph mining | 第59-60页 |
·The problems have to be solved in the frequent subgraph mining | 第60-62页 |
·CONCLUSION OF THIS SECTION | 第62-65页 |
3.FREQUENT SUBGRAPH MINING | 第65-83页 |
·CAM(CANONICAL ADJACENCY MATRIX) AND THEORY | 第65-70页 |
·CAM'S TREE | 第70-72页 |
·CANDIDATE SUBGRAPH GENERATE | 第72-79页 |
·FSubgraphM-Join | 第73-74页 |
·FSubgraphM-Extension | 第74-76页 |
·Suboptimal CAM Tree | 第76-79页 |
·SUPPORT AND FREQUENCY COUNTING | 第79-81页 |
·THE ALGORITHM FSUBGRAPHM OF MINING FREQUENT SUBGRAPH | 第81-82页 |
·CONCLUSION OF THIS SECTION | 第82-83页 |
4.EXPERIMENTS AND ANALYSIS | 第83-87页 |
·PREPROCESSING OF THE PRIMITIVE DATA | 第83-84页 |
·ANALYSIS OF THE RESULT | 第84-85页 |
·ASSOCIATION RULE EXTRACTION | 第85-87页 |
5.CONCLUSIONS AND THE FUTURE WORK | 第87-89页 |
REFERENCES | 第89-97页 |
基于图的数据挖掘算法研究综述 | 第97-143页 |
摘要 | 第99-103页 |
1.引言 | 第103-111页 |
·图的数据挖掘技术的产生背景 | 第104页 |
·目前图的数据挖掘技术方法的分类 | 第104-106页 |
·基于贪心搜索的方法 | 第104-105页 |
·归约数据库方法 | 第105-106页 |
·归约逻辑编程(ILP)方法 | 第106页 |
·数学图论方法 | 第106页 |
·图的数据挖掘技术的应用 | 第106-108页 |
·Web浏览中用户兴趣点的挖掘 | 第106-107页 |
·分子模型分析 | 第107页 |
·CAD线路分析 | 第107页 |
·数据的压缩 | 第107页 |
·生物信息学中的研究 | 第107-108页 |
·图的数据挖掘技术研究历史及现状 | 第108-110页 |
·目前图的数据挖掘技术中的难点和挑战 | 第110-111页 |
2.数据挖掘基础 | 第111-119页 |
·关联规则的基本概念 | 第111-112页 |
·主要关联规则挖掘算法及其模型 | 第112-118页 |
·Apriori算法:使用候选集寻找频繁项集 | 第112-114页 |
·不产生候选集的算法 | 第114-118页 |
·主要算法的优缺点分析 | 第118-119页 |
3.图论基础 | 第119-125页 |
·子图分类 | 第119-120页 |
·子图同构 | 第120-121页 |
·图的不变量 | 第121-122页 |
·图的规范化编码 | 第122-125页 |
4.对频繁子图挖掘的各种算法分析比较 | 第125-133页 |
·频繁子树挖掘 | 第125页 |
·频繁子图挖掘算法的基本概念 | 第125-126页 |
·问题描述 | 第125-126页 |
·频繁子图挖掘的分类 | 第126页 |
·频繁子图挖掘算法分析 | 第126-133页 |
·Apriori算法在频繁子图挖掘中的应用 | 第127-128页 |
·FP-grow算法在频繁子图挖掘中的应用 | 第128-129页 |
·基于gSpan算法的频繁闭子图挖掘算法CloseGraph | 第129-131页 |
·非精确算法 | 第131页 |
·large graph型频繁子图挖掘算法 | 第131页 |
·其他算法 | 第131-133页 |
5.相关工作 | 第133-141页 |
·频繁项集挖掘 | 第133-135页 |
·问题定义 | 第133页 |
·候选项目集的枚举 | 第133-135页 |
·候选集的产生 | 第135页 |
·频繁度计数 | 第135页 |
·序列模式挖掘 | 第135-136页 |
·时间序列模式挖掘 | 第136-137页 |
·最大频繁项集和频繁闭合项集模式挖掘 | 第137-138页 |
·频繁子树挖掘 | 第138-139页 |
·频繁子图挖掘与频繁项目集挖掘比较 | 第139-141页 |
6.总结与展望 | 第141-143页 |
A Survey on Graph-Based Data Mining | 第143-205页 |
ABSTRACT | 第145-149页 |
1.INTRODUCTION | 第149-159页 |
·BACKGROUND OF DATA MINING BASE ON GRAPH | 第150页 |
·APPROACHES OF GRAPH MINING | 第150-154页 |
·Greedy search based Approach | 第151-152页 |
·Inductive Database Based Approach | 第152-153页 |
·Inductive logic programming(ILP) based approach | 第153页 |
·Mathematical Graph Theory Based Approach | 第153-154页 |
·APPLICATIONS OF DATA MINING BASED ON GRAPH | 第154-155页 |
·Web mining | 第154页 |
·Molecule model mining | 第154-155页 |
·CAD circuit analyze | 第155页 |
·Data compress | 第155页 |
·bioinformatics mining | 第155页 |
·THE HISTORY AND STATE OF DATA MINING BASE ON GRAPH | 第155-157页 |
·THE DIFFICULT AND CHANLLENGE OF DATA MINING TECHNOLOGY BASE ON GRAPH | 第157-159页 |
2.PRELIMINARIES OF DATA MINING | 第159-169页 |
·CONCEPT OF ASSOCIATION RULES | 第159-160页 |
·MAINLY ALGORITHM AND MODEL OF ASSOCIATION RULES | 第160-166页 |
·Apriori:A Candidate Generation-and-Test Approach | 第160-163页 |
·FP_Tree:A no Generated Candidate Approach | 第163-166页 |
·ANALYZE MERITE AND INSUFFICIENCY OF MAINLY ALGORITHM | 第166-169页 |
3.GRAPH CONCEPTS | 第169-175页 |
·SUBGRAPH CATEGORIES | 第169-170页 |
·SUBGRAPH ISOMORPHISM | 第170-172页 |
·GRAPH INVARIANTS | 第172页 |
·CANONICAL LABELLING | 第172-175页 |
4.ANALYZE ALGORITHMS FOR MINING FREQUENT SUBGRAPHS | 第175-185页 |
·FREQUENT SUBTREE MINING ALGORITHM | 第175-176页 |
·THE BASIC CONCEPT OF FREQUENT SUBGRAPH MINING ALGORITHM | 第176-177页 |
·The problem describe | 第176页 |
·The classification of frequent subgraph mining | 第176-177页 |
·TO ANALYZE ALGORITHM OF MINING FREQUENT SUBGRAPH | 第177-185页 |
·Apriori algorithm application in the mining frequent subgraph | 第177-179页 |
·FP-grow algorithm application in the mining frequent subgraph | 第179-181页 |
·Frequent Closed Subgraph Mining Algorithm Base on the gSpan | 第181-182页 |
·Non-precise algorithm | 第182-183页 |
·The mibning frequent subgraph in the large graph | 第183页 |
·The Other Algorithm | 第183-185页 |
5.OTHER RELATED WORK | 第185-195页 |
·MINING FREQUENT ITEMSETS | 第185-188页 |
·The problem definition | 第185-186页 |
·Candidate enumeration | 第186-187页 |
·Candidate generation | 第187页 |
·Frequency counting | 第187-188页 |
·MINING SEQUENCE PATTERNS | 第188-189页 |
·MINING TIME SEQUENCE PATTERNS | 第189-190页 |
·MINING MAXIMAL FREQUENT ITEMSET AND FREQUENT CLOSED ITEMSET | 第190-191页 |
·MINING FREQUENT SUBTREE | 第191-193页 |
·COMPARE MINING FREQUENT SUBGRAPH TO FREQUENT ITEMSET | 第193-195页 |
6.CONCLUSION AND FUTURE DIRECTIONS | 第195-197页 |
REFERENCES | 第197-205页 |
致谢 | 第205页 |