基于半结构化数据的数据流挖掘算法研究
摘要 | 第1-7页 |
ABSTRACT | 第7-13页 |
图索引 | 第13-14页 |
表索引 | 第14-15页 |
第一章 绪论 | 第15-35页 |
·研究背景和意义 | 第15-18页 |
·研究背景 | 第15-17页 |
·课题研究意义 | 第17-18页 |
·研究现状 | 第18-27页 |
·数据流管理系统研究现状 | 第19页 |
·数据流挖掘研究现状 | 第19-26页 |
·数据流预测查询算法 | 第20-21页 |
·数据流频繁模式挖掘算法 | 第21-24页 |
·数据流分类算法 | 第24-25页 |
·数据流聚类算法 | 第25-26页 |
·数据流半结构化数据挖掘研究 | 第26-27页 |
·论文主要研究内容 | 第27-29页 |
·论文结构安排 | 第29页 |
参考文献 | 第29-35页 |
第二章 频繁模式挖掘及算法 | 第35-47页 |
·问题定义 | 第36-38页 |
·基本概念 | 第36-37页 |
·事务数据集的表示 | 第37-38页 |
·频繁模式挖掘算法 | 第38-45页 |
·先验原理 | 第38-39页 |
·Apriori算法 | 第39-40页 |
·FP-growth算法 | 第40-43页 |
·频繁模式简约形式挖掘 | 第43-45页 |
·本章小结 | 第45页 |
参考文献 | 第45-47页 |
第三章 半结构化数据的频繁模式挖掘研究 | 第47-71页 |
·引言 | 第47-49页 |
·半结构化数据和相关研究 | 第49-53页 |
·图型结构数据挖掘 | 第49-51页 |
·图集中的频繁子图挖掘算法 | 第50-51页 |
·单图中的频繁子图挖掘算法 | 第51页 |
·序列结构数据挖掘 | 第51-52页 |
·树型结构数据挖掘 | 第52-53页 |
·树型结构数据基本概念 | 第53-58页 |
·树型数据 | 第53-55页 |
·子树的频繁模式 | 第55-58页 |
·基于连接的频繁闭子树挖掘算法 | 第58-67页 |
·DryadeParent算法思路 | 第58-60页 |
·改进算法CFTMiner | 第60-64页 |
·存在的问题 | 第60-62页 |
·改进后的算法 | 第62-64页 |
·正确性分析 | 第64页 |
·实验分析 | 第64-67页 |
·本章小结 | 第67-68页 |
参考文献 | 第68-71页 |
第四章 数据流挖掘的支持度衰减策略 | 第71-89页 |
·引言 | 第71-72页 |
·相关研究 | 第72-74页 |
·问题描述 | 第74-76页 |
·时间模型 | 第74-75页 |
·数据流的定义 | 第75-76页 |
·滑动窗口模型 | 第76页 |
·衰减机制 | 第76-82页 |
·衰减模型 | 第78-80页 |
·补偿放大模型 | 第80-81页 |
·衰减与补偿放大的关系约束 | 第81-82页 |
·实验分析 | 第82-85页 |
·实验环境 | 第82-83页 |
·实时性比较 | 第83-85页 |
·本章小结 | 第85-86页 |
参考文献 | 第86-89页 |
第五章 基于批量更新模式的数据流挖掘研究 | 第89-123页 |
·引言 | 第89-90页 |
·相关研究 | 第90-91页 |
·批量更新模式 | 第91-93页 |
·基于批量更新模式的频繁闭子树挖掘算法 | 第93-104页 |
·挖掘模型 | 第93-95页 |
·数据流批量预处理 | 第95页 |
·闭子树集的添加和删除 | 第95-99页 |
·结果集更新 | 第99-103页 |
·正确性分析 | 第103-104页 |
·算法误差分析 | 第104-111页 |
·衰减误差 | 第105-106页 |
·近似误差 | 第106-108页 |
·累积误差 | 第108-111页 |
·误差分析小结 | 第111页 |
·实验分析 | 第111-121页 |
·实验环境 | 第111-112页 |
·NASA数据集性能对比 | 第112-117页 |
·支持度阈值为50%的评测 | 第113-115页 |
·支持度阈值为25%的评测 | 第115-117页 |
·CSLOGS数据集性能对比 | 第117-119页 |
·精确性评测 | 第119-121页 |
·本章小结 | 第121-122页 |
参考文献 | 第122-123页 |
第六章 结束语 | 第123-126页 |
·研究工作总结 | 第123-124页 |
·未来工作展望 | 第124-126页 |
致谢 | 第126-127页 |
攻读博士学位期间发表的学术论文 | 第127页 |