| 摘要 | 第3-4页 |
| Abstract | 第4页 |
| 1 绪论 | 第7-14页 |
| 1.1 研究背景 | 第7页 |
| 1.2 国内外研究现状 | 第7-12页 |
| 1.2.1 聚类算法研究现状 | 第7-9页 |
| 1.2.2 流式数据处理研究现状 | 第9-12页 |
| 1.3 主要研究内容 | 第12-13页 |
| 1.4 组织结构安排 | 第13-14页 |
| 2 相关背景知识 | 第14-29页 |
| 2.1 聚类算法介绍 | 第14-15页 |
| 2.2 CFSFDP算法介绍 | 第15-18页 |
| 2.3 Spark Streaming框架 | 第18-27页 |
| 2.3.1 Spark平台介绍 | 第18-25页 |
| 2.3.2 Spark Streaming流数据处理框架 | 第25-27页 |
| 2.4 本章小结 | 第27-29页 |
| 3 CFSFDP算法聚类中心自动化选择 | 第29-39页 |
| 3.1 高斯分布异常检测 | 第29-31页 |
| 3.2 自动选择聚类中心 | 第31-34页 |
| 3.3 实验结果与分析 | 第34-38页 |
| 3.4 本章小结 | 第38-39页 |
| 4 CFSFDP算法簇核心与簇光晕的分割优化 | 第39-47页 |
| 4.1 CFSFDP算法簇划分问题分析 | 第39-40页 |
| 4.2 分割优化方法 | 第40-41页 |
| 4.3 实验结果与分析 | 第41-46页 |
| 4.4 本章小结 | 第46-47页 |
| 5 CFSFDP算法流式化实现 | 第47-58页 |
| 5.1 CFSFDP算法并行化可行性分析 | 第47-48页 |
| 5.2 Spark Streaming上的优化的CFSFDP算法并行实现 | 第48-53页 |
| 5.2.1 聚类中心自动化选择的并行实现 | 第48-51页 |
| 5.2.2 数据点划分入簇并行实现 | 第51-52页 |
| 5.2.3 簇核心与簇光晕划分并行实现 | 第52-53页 |
| 5.3 实验结果与分析 | 第53-56页 |
| 5.4 本章小结 | 第56-58页 |
| 6 总结与展望 | 第58-60页 |
| 6.1 全文总结 | 第58页 |
| 6.2 研究前景展望 | 第58-60页 |
| 致谢 | 第60-61页 |
| 参考文献 | 第61-65页 |
| 附录 | 第65页 |