企业员工的离职预测模型
中文摘要 | 第3-4页 |
英文摘要 | 第4页 |
1 绪论 | 第7-10页 |
1.1 选题背景 | 第7页 |
1.2 选题意义 | 第7-8页 |
1.3 研究目的 | 第8页 |
1.4 研究现状 | 第8-9页 |
1.5 研究内容 | 第9-10页 |
2 决策树 | 第10-14页 |
2.1 分类问题 | 第10页 |
2.2 决策树简介 | 第10-11页 |
2.3 决策树基本算法 | 第11-14页 |
2.3.1 熵和条件熵 | 第11-12页 |
2.3.2 信息增益与信息增益比 | 第12页 |
2.3.3 基尼增益 | 第12-13页 |
2.3.4 三种算法的比较 | 第13-14页 |
3 集成学习 | 第14-18页 |
3.1 个体与集成 | 第14页 |
3.2 Bagging和随机森林算法 | 第14-16页 |
3.2.1 Bagging | 第15页 |
3.2.2 随机森林算法 | 第15页 |
3.2.3 Boosting和梯度提升算法 | 第15-16页 |
3.3 梯度提升分类树 | 第16-18页 |
4 数据收集及处理 | 第18-27页 |
4.1 数据来源 | 第18-19页 |
4.2 数据预处理 | 第19-27页 |
4.2.1 处理脏数据 | 第20页 |
4.2.2 数据归一化 | 第20-21页 |
4.2.3 属性变量的量化处理 | 第21页 |
4.2.4 样本倾斜处理 | 第21-25页 |
4.2.5 特征工程 | 第25-27页 |
5 员工离职预测模型设计 | 第27-40页 |
5.1 训练GBM模型 | 第27页 |
5.2 模型评估 | 第27-31页 |
5.3 参数调优 | 第31-34页 |
5.4 探索性分析 | 第34-38页 |
5.5 结论和建议 | 第38-40页 |
6 结论与展望 | 第40-41页 |
6.1 总结 | 第40页 |
6.2 展望 | 第40-41页 |
致谢 | 第41-42页 |
参考文献 | 第42-43页 |