致谢 | 第5-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7页 |
1. 绪论 | 第10-14页 |
1.1 课题研究背景及意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-12页 |
1.3 论文研究内容 | 第12-13页 |
1.4 论文结构安排 | 第13-14页 |
2. 理论基础 | 第14-34页 |
2.1 数据流与数据流聚类算法 | 第14-21页 |
2.1.1 数据流及基本技术 | 第14-16页 |
2.1.2 数据流聚类算法 | 第16-21页 |
2.2 高维数据降维技术 | 第21-26页 |
2.2.1 线性降维 | 第21-23页 |
2.2.2 非线性降维 | 第23-25页 |
2.2.3 高维数据流聚类算法研究现状 | 第25-26页 |
2.3 分布式数据流处理技术 | 第26-33页 |
2.3.1 分布式数据流聚类算法研究与现状 | 第26-29页 |
2.3.2 分布式数据流处理框架 | 第29-33页 |
2.4 本章小结 | 第33-34页 |
3. 降维预处理算法 | 第34-43页 |
3.1 核函数与核PCA | 第34-36页 |
3.1.1 核函数 | 第34-35页 |
3.1.2 KPCA原理 | 第35-36页 |
3.2 基于核函数的分布式降维算法DKPCA | 第36-42页 |
3.2.1 KPCA的分布式设计与实现 | 第37-39页 |
3.2.2 KPCA降维测试 | 第39-42页 |
3.3 本章小结 | 第42-43页 |
4. 改进的分布式数据流聚类算法 | 第43-67页 |
4.1 基于衰减时间窗口的改进聚类算法S-CluStream | 第44-52页 |
4.1.1 S-CluStream设计与原理 | 第44-50页 |
4.1.2 S-CluStream离群点处理机制存在的问题 | 第50-52页 |
4.2 离群点过滤删除策略 | 第52-61页 |
4.2.1 离群点检测算法分类 | 第52-55页 |
4.2.2 加权欧式距离定义 | 第55-56页 |
4.2.3 LDOF与改进的加权局部离群因子WLDOF | 第56-58页 |
4.2.4 改进的加入局部离群点判断的聚类算法AS-CluStream | 第58-61页 |
4.3 实验及分析 | 第61-66页 |
4.3.1 环境配置 | 第61-63页 |
4.3.2 可扩展性实验与评估 | 第63-65页 |
4.3.3 聚类质量实验与评估 | 第65-66页 |
4.4 本章小结 | 第66-67页 |
5. 总结与展望 | 第67-68页 |
参考文献 | 第68-71页 |
附录A | 第71-81页 |
降维测试数据 | 第71-75页 |
投影数据 | 第75-81页 |
作者简历及攻读硕士学位期间取得的研究成果 | 第81-83页 |
学位论文数据集 | 第83页 |