摘要 | 第1-6页 |
Abstract | 第6-15页 |
第一章 绪论 | 第15-22页 |
·研究背景 | 第15页 |
·流数据挖掘 | 第15-18页 |
·流数据特点 | 第15-16页 |
·流数据挖掘的挑战 | 第16页 |
·流数据挖掘模型 | 第16-18页 |
·本文的主要研究工作 | 第18-20页 |
·本文的组织结构 | 第20-22页 |
第二章 流数据挖掘研究现状 | 第22-35页 |
·流数据挖掘相关实现技术 | 第22-24页 |
·抽样法 | 第22页 |
·直方图法 | 第22-23页 |
·滑动窗口法 | 第23页 |
·小波法 | 第23页 |
·哈希(散列法) | 第23-24页 |
·梗概技术 | 第24页 |
·流数据挖掘系统 | 第24-25页 |
·流数据挖掘算法综述 | 第25-34页 |
·流数据频繁项挖掘算法研究 | 第25-27页 |
·流数据聚类挖掘算法研究 | 第27-30页 |
·流数据分类算法研究 | 第30-33页 |
·其他流数据挖掘算法研究 | 第33-34页 |
·本章小结 | 第34-35页 |
第三章 基于滑动窗口的流数据频繁项挖掘 | 第35-54页 |
·背景介绍 | 第35-37页 |
·问题描述和相关概念 | 第37-40页 |
·滑动窗口 | 第37-39页 |
·基于滑动窗口的ε -近似频繁项挖掘 | 第39-40页 |
·基本数据结构 | 第40-42页 |
·哈希表H | 第40-41页 |
·Link_Q 链表 | 第41页 |
·尾数链表Link_P | 第41-42页 |
·挖掘基于滑动窗口的数据流频繁项的SC 算法 | 第42-48页 |
·SC 算法框架 | 第42-43页 |
·算法实现 | 第43-45页 |
·一个示例 | 第45-47页 |
·查询算法 | 第47-48页 |
·算法分析 | 第48-50页 |
·算法的误差分析 | 第48-49页 |
·算法空间复杂度分析 | 第49-50页 |
·算法时间复杂度分析 | 第50页 |
·实验结果与分析 | 第50-52页 |
·时间和空间性能分析 | 第50-51页 |
·算法准确率分析 | 第51-52页 |
·算法的扩展 | 第52-53页 |
·本章小结 | 第53-54页 |
第四章 基于时间衰减模型的流数据频繁项挖掘 | 第54-72页 |
·背景介绍 | 第54-55页 |
·数据项密度 | 第55-56页 |
·算法FC1 及其改进算法FC2 | 第56-64页 |
·算法FC1 框架 | 第56-59页 |
·FC1 算法复杂度分析 | 第59-60页 |
·改进算法FC2 的框架 | 第60-62页 |
·FC2 算法复杂度分析 | 第62页 |
·实验结果与分析 | 第62-64页 |
·λ-Count 算法 | 第64-71页 |
·λ-Count 算法框架 | 第65-67页 |
·查询算法Query3(t) | 第67-68页 |
·数据结构 | 第68-69页 |
·算法复杂度分析 | 第69页 |
·实验结果与分析 | 第69-71页 |
·本章小结 | 第71-72页 |
第五章 基于网格密度和吸引度的流数据聚类 | 第72-97页 |
·背景介绍 | 第72-74页 |
·D-Stream 算法框架 | 第74-75页 |
·密度网格 | 第75-83页 |
·网格的吸引度 | 第76-78页 |
·网格密度 | 第78-80页 |
·基于密度的网格聚类 | 第80-81页 |
·随时间变化的吸引度 | 第81-83页 |
·算法D-Stream 的实现 | 第83-91页 |
·网格检查和时间间隔gap | 第83-85页 |
·检测并移除奇异网格 | 第85-88页 |
·聚类算法 | 第88-91页 |
·算法实验与性能评价 | 第91-96页 |
·有许多孤立点的变化数据流 | 第91-93页 |
·聚类质量比较 | 第93-95页 |
·时间和空间性能比较 | 第95-96页 |
·本章小结 | 第96-97页 |
第六章 基于相关分析的多数据流聚类 | 第97-114页 |
·背景介绍 | 第97-98页 |
·问题描述和相关概念 | 第98-99页 |
·数据流聚类 | 第98页 |
·时间片段 | 第98-99页 |
·数据流相似度量 | 第99-103页 |
·数据流对的Kendall 相关系数 | 第99-100页 |
·U 统计量 | 第100-101页 |
·AU 统计量 | 第101-102页 |
·AU 统计量的计算 | 第102-103页 |
·多数据流聚类过程 | 第103-107页 |
·基于相关分析的多数据流聚类算法CA-Cluster | 第103-105页 |
·动态k-means 算法 | 第105-107页 |
·任意长度聚类 | 第107-108页 |
·实验结果及分析 | 第108-113页 |
·测试数据 | 第109页 |
·CA-cluster 算法性能分析 | 第109-112页 |
·CA-COD 性能分析 | 第112-113页 |
·本章小结 | 第113-114页 |
第七章 结论与进一步的工作 | 第114-116页 |
·全文总结 | 第114-115页 |
·进一步的工作展望 | 第115-116页 |
参考文献 | 第116-127页 |
致谢 | 第127-128页 |
在学期间的研究成果及发表的学术论文 | 第128-129页 |