中文摘要 | 第3-4页 |
英文摘要 | 第4页 |
第一章 绪论 | 第7-13页 |
1.1 背景介绍 | 第7-8页 |
1.2 国内外研究现状 | 第8-11页 |
1.2.1 针对不均衡数据集的重采样算法研究 | 第9-11页 |
1.2.2 针对不均衡数据集的分类算法研究 | 第11页 |
1.3 研究内容和主要工作 | 第11-12页 |
1.4 论文结构安排 | 第12-13页 |
第二章 集成学习算法介绍 | 第13-19页 |
2.1 Bagging算法和随机森林 | 第13-14页 |
2.2 AdaBoost算法 | 第14-15页 |
2.3 XGBoost算法 | 第15-19页 |
2.3.1 XGBoost模型函数形式及目标函数 | 第15-16页 |
2.3.2 additrivetraining方法 | 第16-18页 |
2.3.3 树的生成 | 第18-19页 |
第三章 分类性能评价指标 | 第19-23页 |
3.1 召回率、精确率、Fβ值、G-mean | 第19-21页 |
3.2 ROC曲线和AUC值 | 第21-23页 |
第四章 复合XGBoost模型在用户商品偏好预测中的应用 | 第23-36页 |
4.1 背景介绍 | 第23页 |
4.2 数据集合 | 第23-28页 |
4.2.1 构建特征变量 | 第23-24页 |
4.2.2 数据获取 | 第24页 |
4.2.3 数据预处理 | 第24-26页 |
4.2.4 描述性统计分析 | 第26-28页 |
4.3 模型构建 | 第28-32页 |
4.3.1 复合逻辑斯蒂回归模型 | 第29页 |
4.3.2 集成学习模型 | 第29-30页 |
4.3.3 .复合XGBoost模型 | 第30-32页 |
4.4 分类器性能分析及模型选择 | 第32-33页 |
4.5 EasyEnsemble-XGB模型应用结果分析 | 第33-36页 |
第五章 总结与展望 | 第36-38页 |
5.1 总结 | 第36-37页 |
5.2 展望 | 第37-38页 |
参考文献 | 第38-40页 |
致谢 | 第40页 |