摘要 | 第3-4页 |
ABSTRACT | 第4页 |
1 引言 | 第7-12页 |
1.1 研究背景及意义 | 第7-8页 |
1.1.1 研究背景 | 第7页 |
1.1.2 研究意义 | 第7-8页 |
1.2 国内外研究现状 | 第8-10页 |
1.2.1 数据聚类技术研究现状 | 第8-9页 |
1.2.2 大数据处理研究现状 | 第9页 |
1.2.3 基于大数据的森林生态站数据聚类系统研究现状 | 第9-10页 |
1.3 论文的研究内容 | 第10页 |
1.4 论文的组织结构 | 第10-12页 |
2 系统框架与Hadoop分布式系统架构相关知识 | 第12-16页 |
2.1 系统整体框架 | 第12-13页 |
2.2 Hadoop简介 | 第13-15页 |
2.2.1 HDFS分布式文件系统简介 | 第13-14页 |
2.2.2 MapReduce分布式计算模型原理 | 第14-15页 |
2.3 小结 | 第15-16页 |
3 森林生态站数据聚类相关知识及算法 | 第16-36页 |
3.1 森林生态站数据预处理 | 第16-19页 |
3.2 K-means与K-midoids聚类算法 | 第19-24页 |
3.2.1 K-means聚类算法 | 第20-22页 |
3.2.2 K-midoids聚类算法 | 第22-24页 |
3.2.3 K-means与K-midoids聚类算法对比 | 第24页 |
3.3 基于有序数组的分布式层次聚类算法 | 第24-35页 |
3.3.1 基于树结构中结点覆盖关系的层次化聚类原理 | 第24-27页 |
3.3.2 层次聚类在分布式环境下的实现障碍 | 第27-29页 |
3.3.3 单机层次聚类剪枝和朴素分布式方案概述 | 第29-30页 |
3.3.4 DHCSA算法原理概述 | 第30-33页 |
3.3.5 DHCSA层次聚类算法实验方法与结果分析 | 第33-34页 |
3.3.6 DHCSA层次聚类算法总结 | 第34-35页 |
3.4 小结 | 第35-36页 |
4 基于大数据处理的森林生态站数据聚类系统设计 | 第36-41页 |
4.1 系统功能模块 | 第36-37页 |
4.2 系统非功能需求 | 第37-38页 |
4.3 系统详细设计 | 第38-40页 |
4.3.1 系统数据库设计 | 第38页 |
4.3.2 用户权限与系统用例 | 第38-40页 |
4.4 小结 | 第40-41页 |
5 基于大数据处理的森林生态站数据聚类系统的实现及分析 | 第41-51页 |
5.1 系统实现平台 | 第41页 |
5.2 系统功能模块的实现 | 第41-50页 |
5.2.1 系统管理模块 | 第42-43页 |
5.2.2 指标与权限管理模块 | 第43-44页 |
5.2.3 数据管理模块 | 第44-45页 |
5.2.4 聚类分析模块 | 第45-50页 |
5.3 小结 | 第50-51页 |
6 结论与展望 | 第51-53页 |
6.1 结论 | 第51-52页 |
6.2 展望 | 第52-53页 |
参考文献 | 第53-56页 |
个人简介 | 第56-57页 |
导师简介 | 第57-58页 |
获得成果目录清单 | 第58-59页 |
致谢 | 第59页 |