基于随机森林算法的作弊网页检测方法研究

摘要	第5-6页
Abstract	第6页
第1章引言	第10-14页
1.1 研究背景	第10-11页
1.2 研究意义	第11-12页
1.3 论文主要工作	第12-13页
1.4 论文组织结构	第13-14页
第2章论文相关知识	第14-30页
2.1 网页作弊方法分析	第14-15页
2.2 机器学习	第15-16页
2.3 分类算法	第16-26页
2.3.1 朴素贝叶斯算法	第17-18页
2.3.2 K最近邻(KNN)算法	第18页
2.3.3 支持向量机算法	第18-20页
2.3.4 决策树算法	第20-23页
2.3.5 随机森林算法	第23-26页
2.4 聚类算法	第26-29页
2.4.1 基于K均值算法	第26-27页
2.4.2 二分K均值算法	第27-29页
2.5 小结	第29-30页
第3章基于随机森林算法的作弊网页检测方法	第30-39页
3.1 作弊网页数据集分类问题的解决方法	第30-33页
3.1.1 优化算法的方法	第30-31页
3.1.2 优化数据的方法	第31-33页
3.2 随机森林处理作弊网页数据集分类问题的改进-BKM_SMOTE算法	第33-34页
3.3 作弊网页检测系统设计	第34-38页
3.3.1 框架设计	第34-35页
3.3.2 特征提取模块	第35-36页
3.3.3 随机森林模块设计	第36页
3.3.4 数据库设计	第36-38页
3.3.5 反馈学习模块	第38页
3.4 本章小结	第38-39页
第4章实现结果与分析	第39-48页
4.1 数据集	第39-40页
4.2 实验环境	第40页
4.3 实验结果及分析	第40-46页
4.3.1 随机森林使用BKM_SMOTE算法提升性能的实证分析	第40-43页
4.3.2 作弊网页检测系统实证分析	第43-46页
4.3.3 系统检测效率	第46页
4.4 本章小结	第46-48页
第5章结论	第48-50页
5.1 研究内容总结	第48页
5.2 工作展望	第48-50页
致谢	第50-51页
参考文献	第51-53页