半监督随机森林分类算法及其并行化研究

中文摘要	第3-4页
英文摘要	第4-5页
1 绪论	第8-14页
1.1 研究背景及意义	第8-9页
1.2 国内外研究现状	第9-12页
1.2.1 半监督学习研究现状	第9-11页
1.2.2 随机森林算法研究现状	第11-12页
1.3 本文主要研究内容	第12-13页
1.4 本文组织结构	第13-14页
2 半监督分类算法理论基础	第14-25页
2.1 半监督学习	第14-15页
2.2 分类相关概念及基本原理	第15-16页
2.3 随机森林分类	第16-18页
2.4 几种典型的半监督分类算法	第18-24页
2.4.1 Self-Training算法	第18-19页
2.4.2 Co-Training算法	第19页
2.4.3 Tri-Training算法	第19-22页
2.4.4 Co-Forest算法	第22-24页
2.5 本章小结	第24-25页
3 基于分组及数据剪辑的半监督随机森林算法NC-Forest	第25-43页
3.1 算法的提出	第25-26页
3.2 算法原理	第26-30页
3.2.1 算法收敛性	第26-27页
3.2.2 数据剪辑策略	第27-28页
3.2.3 决策树分组	第28-30页
3.3 NC-Forest算法描述	第30-33页
3.4 实验结果及分析	第33-42页
3.4.1 实验数据	第33-34页
3.4.2 实验结果及分析	第34-42页
3.5 本章小结	第42-43页
4 基于Spark的半监督随机森林分类算法DNC-Forest	第43-55页
4.1 Spark随机森林现状	第43-45页
4.2 DNC-Forest算法描述	第45-49页
4.3 实验结果及分析	第49-54页
4.3.1 实验环境	第49-50页
4.3.2 实验数据	第50页
4.3.3 实验结果及分析	第50-54页
4.4 本章小结	第54-55页
5 总结与展望	第55-57页
5.1 全文总结	第55-56页
5.2 后续研究工作的展望	第56-57页
致谢	第57-58页
参考文献	第58-61页
附录	第61页
A. 作者在攻读学位期间申请的专利	第61页