首页--经济论文--工业经济论文--中国工业经济论文--工业部门经济论文

基于XGBoost算法的窃电用户行为研究

摘要第4-5页
Abstract第5-6页
1 绪论第10-15页
    1.1 研究背景和研究意义第10-11页
        1.1.1 研究背景第10-11页
        1.1.2 研究意义第11页
    1.2 研究现状第11-13页
    1.3 研究目标和研究内容第13-14页
    1.4 论文组织结构第14-15页
2 大数据分类算法第15-28页
    2.1 决策树算法第15-19页
        2.1.1 决策树算法概述第15-16页
        2.1.2 ID3算法第16-17页
        2.1.3 C4.5算法第17-18页
        2.1.4 分类回归树第18-19页
    2.2 随机森林算法第19-21页
        2.2.1 随机森林算法概述第19页
        2.2.2 随机性的引入第19页
        2.2.3 随机森林的构建第19-21页
    2.3 XGBoost算法第21-27页
        2.3.1 Boosting算法概述第22页
        2.3.2 梯度提升树算法概述第22-23页
        2.3.3 XGBoost算法概述第23-26页
        2.3.4 XGBoost参数第26-27页
    2.4 本章小结第27-28页
3 数据探索与数据清洗第28-38页
    3.1 数据探索第28-31页
        3.1.1 数据探索的特点第28-29页
        3.1.2 数据探索的内容第29页
        3.1.3 数据探索的方法第29-31页
    3.2 数据清洗第31-33页
        3.2.1 缺失值处理第31-33页
        3.2.2 异常值处理第33页
        3.2.3 重复值处理第33页
    3.3 数据探索与清洗的实现第33-37页
        3.3.1 数据来源第33页
        3.3.2 数据探索的实现第33-36页
        3.3.3 数据清洗的实现第36-37页
    3.4 本章小结第37-38页
4 特征提取第38-44页
    4.1 特征提取的定义第38页
    4.2 特征提取的意义第38-39页
    4.3 皮尔逊相关系数第39-41页
    4.4 特征提取的实现第41-43页
    4.5 本章小结第43-44页
5 分类识别与评价第44-53页
    5.1 模型构建第44-45页
        5.1.1 实验平台第44页
        5.1.2 参数设置第44页
        5.1.3 数据集的构建第44页
        5.1.4 交叉验证方法第44-45页
    5.2 评价指标第45-46页
        5.2.1 混淆矩阵第45-46页
        5.2.2 ROC曲线与AUC第46页
    5.3 实验结果第46-51页
        5.3.1 XGBoost模型实验结果第46-47页
        5.3.2 不平衡数据集下其他模型实验结果第47-49页
        5.3.3 平衡数据集下其他模型实验结果第49-51页
    5.4 结果分析第51页
    5.5 特征重要度分析第51-52页
    5.6 本章小结第52-53页
结论第53-54页
致谢第54-55页
参考文献第55-58页
攻读学位期间的研究成果第58页

论文共58页,点击 下载论文
上一篇:分级TiO2光阳极制备及在染料敏化太阳能电池中应用
下一篇:光热发电参与电力系统调峰策略研究