基于电力大数据的并行数据挖掘系统的研究
中文摘要 | 第3-4页 |
Abstract | 第4-5页 |
第一章 引言 | 第8-14页 |
1.1 课题研究的背景和意义 | 第8-9页 |
1.2 国内外研究现状 | 第9-13页 |
1.2.1 电力大数据研究现状 | 第9-11页 |
1.2.2 数据挖掘系统研究现状 | 第11-13页 |
1.3 本文主要工作及内容安排 | 第13-14页 |
第二章 并行数据挖掘系统的关键技术 | 第14-29页 |
2.1 Hadoop介绍 | 第14-17页 |
2.2 Spark介绍 | 第17-19页 |
2.3 并行数据挖掘相关概念 | 第19-22页 |
2.4 特征选择相关概念 | 第22-26页 |
2.4.1 特征选择方法的分类 | 第22-23页 |
2.4.2 特征选择的搜索策略 | 第23-24页 |
2.4.3 评价特征重要性的标准 | 第24-26页 |
2.5 典型聚类算法 | 第26-28页 |
2.5.1 基于划分的聚类 | 第26-27页 |
2.5.2 层次聚类 | 第27页 |
2.5.3 基于密度的聚类 | 第27-28页 |
2.6 本章小结 | 第28-29页 |
第三章 基于电力大数据的并行数据挖掘系统的设计 | 第29-48页 |
3.1 项目需求 | 第29-30页 |
3.2 整体设计 | 第30-31页 |
3.3 研究内容 | 第31-32页 |
3.4 现有基础 | 第32-33页 |
3.5 并行数据分析与挖掘服务统一模型的设计 | 第33-37页 |
3.5.1 算子的抽象 | 第33-34页 |
3.5.2 上下文的抽象 | 第34-35页 |
3.5.3 测试算子和上下文的抽象 | 第35-36页 |
3.5.4 框架公用部分 | 第36-37页 |
3.5.5 数据和元数据格式 | 第37页 |
3.6 并行数据预处理的设计 | 第37-40页 |
3.7 并行数据分析与挖掘工作流格式的设计 | 第40-42页 |
3.8 并行数据分析与挖掘可视化层的设计 | 第42-47页 |
3.9 本章小结 | 第47-48页 |
第四章 基于联合互信息和聚类的特征选择方法 | 第48-58页 |
4.1 引言 | 第48-49页 |
4.2 相关工作 | 第49-50页 |
4.3 特征选择的信息度量 | 第50-51页 |
4.4 用于距离矩阵聚类的方法 | 第51-53页 |
4.4.1 K中心点 | 第51-52页 |
4.4.2 自底向上的层次聚类 | 第52-53页 |
4.5 聚类与特征选择 | 第53-54页 |
4.6 算法流程 | 第54-55页 |
4.7 实验比较 | 第55-57页 |
4.7.1 数据集 | 第55页 |
4.7.2 实验设置 | 第55-56页 |
4.7.3 实验结果与分析 | 第56-57页 |
4.8 本章小结 | 第57-58页 |
第五章 基于密度的混合层次聚类方法 | 第58-69页 |
5.1 引言 | 第58-59页 |
5.2 层次聚类方法的比较 | 第59-60页 |
5.3 密度与层次聚类 | 第60-62页 |
5.3.1 本方法中密度的定义 | 第60-61页 |
5.3.2 密度在本方法中的应用 | 第61-62页 |
5.4 算法流程 | 第62-63页 |
5.5 实验比较 | 第63-68页 |
5.5.1 实验设置 | 第63-64页 |
5.5.2 聚类结果的评估标准 | 第64-66页 |
5.5.3 实验结果与分析 | 第66-68页 |
5.6 本章小结 | 第68-69页 |
结论 | 第69-70页 |
参考文献 | 第70-75页 |
致谢 | 第75-76页 |
个人简历 | 第76-77页 |
在学期间的研究成果及发表的学术论文 | 第77页 |