基于数据流的聚类算法研究

摘要	第5-7页
abstract	第7-8页
第1章绪论	第11-18页
1.1 数据流挖掘的背景与意义	第11-12页
1.2 数据流挖掘的研究现状与发展	第12-15页
1.2.1 数据流聚类	第12-13页
1.2.2 数据流分类	第13-14页
1.2.3 数据流频繁项集挖掘	第14页
1.2.4 数据流挖掘的发展	第14-15页
1.3 数据流挖掘的应用	第15-16页
1.4 论文内容和组织结构	第16-17页
1.5 本章小结	第17-18页
第2章数据流聚类	第18-33页
2.1 聚类概述	第18-19页
2.2 数据流聚类基本定义和概述	第19-21页
2.2.1 数据流的定义	第19页
2.2.2 数据流的特点	第19-20页
2.2.3 传统数据与数据流的比较	第20-21页
2.3 数据流相似性度量	第21-24页
2.3.1 数据的类型	第21-22页
2.3.2 距离的定义	第22-23页
2.3.3 非距离度量法	第23-24页
2.4 数据流处理技术	第24-27页
2.4.1 概要数据结构	第24-26页
2.4.2 时间倾斜技术	第26-27页
2.5 数据流聚类算法	第27-32页
2.5.1 数据流聚类算法的要求	第28-30页
2.5.2 数据流聚类算法简介	第30-32页
2.6 本章小结	第32-33页
第3章基于区间数的不确定数据流 2k近邻聚类算法	第33-44页
3.1 不确定数据流聚类概述	第33-35页
3.1.1 不确定数据流产生的原因	第33页
3.1.2 不确定性对数据流聚类的影响	第33-34页
3.1.3 不确定数据流聚类相关研究	第34-35页
3.2 不确定数据模型	第35-37页
3.3 UIDS tre am算法	第37-40页
3.3.1 在线 2k-近邻微簇的生成算法	第38页
3.3.2 最优 2k-近邻微簇的生成算法	第38-39页
3.3.3 最优 2k-近邻微簇的离线聚类算法	第39-40页
3.4 实验与分析	第40-43页
3.4.1 实验所用数据集	第40-41页
3.4.2 实验比较	第41-43页
3.5 本章小结	第43-44页
第4章一种基于时间衰减的数据流聚类算法	第44-56页
4.1 引言	第44-45页
4.1.1 数据流聚类	第44-45页
4.1.2 时间衰减对数据流聚类的影响	第45页
4.1.3 研究的动机与意义	第45页
4.2 相关概念	第45-47页
4.3 相似度计算方法	第47-48页
4.3.1 数据对象与微簇的相似度	第47页
4.3.2 微簇与微簇之间的相似度	第47-48页
4.4 TF-Stre am算法	第48-51页
4.4.1 TF-Stream在线微聚类算法	第48-49页
4.4.2 TF-Stream离线宏聚类算法	第49-51页
4.5 实验与分析	第51-55页
4.5.1 实验所用数据集	第51页
4.5.2 实验比较	第51-55页
4.6 本章小结	第55-56页
第5章总结与展望	第56-58页
5.1 总结	第56页
5.2 展望	第56-58页
参考文献	第58-61页
致谢	第61-62页
攻读学位期间参加的科研项目和成果	第62页