基于电力大数据的数据挖掘支撑子系统的设计与实现

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第9-14页
1.1 研究背景	第9页
1.2 国内外研究现状	第9-10页
1.3 主要研究内容	第10-12页
1.4 论文总体结构	第12-14页
第二章相关技术	第14-24页
2.1 Hadoop分布式储存系统	第14-17页
2.2 数据清洗技术	第17-20页
2.2.1 数据清洗的定义	第17-18页
2.2.2 数据清洗的基本原理和方法	第18页
2.2.3 清洗数据算法	第18-19页
2.2.4 数据清洗的一般性框架	第19-20页
2.3 机器学习和weka库	第20-23页
2.3.1 机器学习概述	第20-22页
2.3.2 weka开源平台	第22-23页
2.4 本章小结	第23-24页
第三章需求分析	第24-28页
3.1 上下文环境	第24页
3.2 功能性需求	第24-27页
3.2.1 基于电力大数据的数据存取	第25-26页
3.2.2 基于电力大数据的多源数据融合	第26页
3.2.3 基于电力大数据的数据清洗	第26-27页
3.3 非功能性需求	第27页
3.4 本章小结	第27-28页
第四章关键问题研究	第28-40页
4.1 多源数据融合	第28-29页
4.2 基于机器学习的数据清洗	第29-33页
4.2.1 基础的数据清洗	第30-32页
4.2.2 基于机器学习的清洗验证	第32-33页
4.3 电网故障分类场景下的SVM参数调优	第33-38页
4.3.1 场景定义	第34-35页
4.3.2 核函数选择	第35-36页
4.3.3 惩罚因子及核函数参数调整	第36-38页
4.3.4 SVM参数调优小结	第38页
4.4 本章小结	第38-40页
第五章总体设计	第40-49页
5.1 系统总体架构	第40-41页
5.2 系统功能模块	第41-44页
5.2.1 数据存取模块	第42页
5.2.2 数据融合模块	第42-43页
5.2.3 数据清洗模块	第43-44页
5.3 基本工作流程	第44-47页
5.3.1 数据文件存取	第44-45页
5.3.2 数据文件融合	第45-46页
5.3.3 数据文件清洗	第46-47页
5.4 接口设计	第47-48页
5.5 本章小结	第48-49页
第六章关键模块设计与实现	第49-59页
6.1 数据存取模块	第49-51页
6.1.1 分布式文件储存系统的管理	第49-50页
6.1.2 数据存取	第50-51页
6.2 数据融合模块	第51-53页
6.3 数据清洗模块	第53-58页
6.4 本章小结	第58-59页
第七章系统测试	第59-69页
7.1 测试环境	第59-60页
7.1.1 软件环境	第59页
7.1.2 硬件环境	第59-60页
7.2 单元测试	第60-67页
7.3 集成测试	第67-68页
7.4 测试结果	第68页
7.5 本章小结	第68-69页
第八章结束语	第69-71页
8.1 工作总结	第69-70页
8.2 未来展望	第70-71页
参考文献	第71-73页
致谢	第73-74页
作者攻读学位期间发表的学术论文目录	第74页