基于数据挖掘的用电数据异常的分析与研究
致谢 | 第5-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7-8页 |
1 绪论 | 第11-21页 |
1.1 研究背景及意义 | 第11-13页 |
1.1.1 研究背景 | 第11-12页 |
1.1.2 研究意义 | 第12-13页 |
1.2 国内外主要研究现状 | 第13-17页 |
1.3 研究主要内容 | 第17-21页 |
2 数据挖掘理论与用电异常数据的特点 | 第21-41页 |
2.1 数据挖掘理论简介 | 第21-24页 |
2.1.1 数据挖掘的定义 | 第21页 |
2.1.2 数据挖掘的过程 | 第21-23页 |
2.1.3 R语言与数据挖掘 | 第23-24页 |
2.2 数据挖掘算法 | 第24-30页 |
2.2.1 孤立森林算法 | 第24-27页 |
2.2.2 决策树算法 | 第27-30页 |
2.3 检测模型评价方法 | 第30-33页 |
2.3.1 混淆矩阵 | 第30-31页 |
2.3.2 ROC曲线与AUC | 第31-32页 |
2.3.3 累积查全率曲线与P-R曲线 | 第32-33页 |
2.4 用电异常数据的特点 | 第33-39页 |
2.4.1 用电信息采集系统的物理架构及主要功能 | 第33-35页 |
2.4.2 用电数据的采集 | 第35-37页 |
2.4.3 用电数据异常原因及特点 | 第37-39页 |
2.5 本章小结 | 第39-41页 |
3 基于孤立森林算法的用电数据异常检测 | 第41-59页 |
3.1 异常检测模型的数据基础 | 第41-44页 |
3.1.1 字段选择 | 第41-42页 |
3.1.2 数据清洗 | 第42页 |
3.1.3 数据降维 | 第42-44页 |
3.2 基于孤立森林算法的用电异常检测模型 | 第44-46页 |
3.2.1 iTree的构造 | 第44-45页 |
3.2.2 孤立森林的构造 | 第45-46页 |
3.3 模型参数分析 | 第46-52页 |
3.3.1 iTree的数量t | 第46-49页 |
3.3.2 iTree的采样数Ψ | 第49-52页 |
3.4 与其他异常检测模型比较 | 第52-57页 |
3.5 本章小结 | 第57-59页 |
4 基于决策树算法的用电数据异常识别 | 第59-71页 |
4.1 用电数据异常识别模型中电气变量的选择 | 第59-61页 |
4.1.1 电气变量的选择 | 第59-60页 |
4.1.2 计量点处电气变量的特点 | 第60-61页 |
4.2 用电数据异常识别模型的构建 | 第61-64页 |
4.3 现场核实 | 第64-69页 |
4.3.1 典型案例分析 | 第64-66页 |
4.3.2 电量追补更正系数方法的改进 | 第66-69页 |
4.4 本章小结 | 第69-71页 |
5 总结与展望 | 第71-73页 |
5.1 总结 | 第71-72页 |
5.2 展望 | 第72-73页 |
参考文献 | 第73-77页 |
作者简历 | 第77-81页 |
学位论文数据集 | 第81页 |