基于数据挖掘的消费者购买预测的研究
摘要 | 第3-5页 |
Abstract | 第5-6页 |
第一章 引言 | 第10-22页 |
第一节 选题背景 | 第10-11页 |
第二节 研究目的和意义 | 第11页 |
第三节 文献综述 | 第11-13页 |
第四节 推荐系统发展概述 | 第13-21页 |
一、基于人口统计学的推荐 | 第13页 |
二、基于关联规则的推荐系统 | 第13-15页 |
三、基于协同过滤算法的推荐系统 | 第15-18页 |
四、基于混合推荐策略构建推荐模型 | 第18-19页 |
五、推荐系统的发展趋势 | 第19-21页 |
第五节 论文的组织结构 | 第21-22页 |
第二章 数据处理 | 第22-32页 |
第一节 数据源介绍 | 第22-23页 |
第二节 数据探查 | 第23-27页 |
一、用户购买商品总数的分布 | 第23页 |
二、商品销售数量的分布 | 第23-24页 |
四、商品交互过的用户数量的分布 | 第24-25页 |
五、用户与商品交互的四种行为分布 | 第25页 |
六、三种基本行为导致购买的转化率 | 第25-26页 |
七、交易量随时间的分布 | 第26-27页 |
第三节 数据清洗 | 第27-28页 |
一、噪声来源分析 | 第27页 |
二、消除噪声 | 第27-28页 |
第四节 样本选取 | 第28-32页 |
一、正负样本的设定 | 第28-30页 |
二、对正负样本比例不均衡的处理 | 第30-32页 |
第三章 特征工程 | 第32-41页 |
第一节 特征工程简介 | 第32页 |
第二节 特征工程的组成 | 第32-36页 |
一、特征提取 | 第32-34页 |
二、特征的选择 | 第34-36页 |
三、构建特征体系的流程 | 第36页 |
第三节 特征设计思路的补充 | 第36-38页 |
一、构建商品类别特征 | 第36-37页 |
二、商品竞争力特征 | 第37页 |
三、商品热卖趋势 | 第37页 |
四、双十二的影响 | 第37-38页 |
第四节 特征构造展示 | 第38-41页 |
一、用户特征 | 第38-39页 |
二、商品特征 | 第39页 |
三、商品类别特征 | 第39-40页 |
四、用户与商品的交互特征 | 第40-41页 |
第四章 算法介绍 | 第41-45页 |
第一节 逻辑回归算法介绍 | 第41-43页 |
第二节 GBDT算法介绍 | 第43-45页 |
第五章 实验结果与分析 | 第45-55页 |
第一节 模型评价指标 | 第45-47页 |
一、混淆矩阵 | 第45-46页 |
二、ROC曲线图 | 第46-47页 |
第二节 基于逻辑回归的预测模型 | 第47-49页 |
一、逻辑回归的参数设置 | 第47页 |
二、防止过拟合 | 第47-48页 |
三、模型评价 | 第48-49页 |
第三节 基于GDBT的预测模型 | 第49-51页 |
一、GDBT参数设置 | 第49页 |
二、模型评价 | 第49-51页 |
第四节 两种模型的比较 | 第51-52页 |
一、预测效果的比较 | 第51-52页 |
二、时间成本与运算成本的比较 | 第52页 |
三、可解释性 | 第52页 |
第五节 模型融合 | 第52-55页 |
一、模型融合的方式 | 第52-53页 |
二、模型评估 | 第53页 |
三、模型比较 | 第53-55页 |
第六章 总结 | 第55-59页 |
第一节 模型在电子商务中的现实意义 | 第55-56页 |
第二节 模型改进 | 第56-59页 |
参考文献 | 第59-62页 |
致谢 | 第62页 |