CHAID算法并行化及其在信用风险分析中的应用

摘要	第1-4页
Abstract	第4-7页
第一章绪论	第7-11页
·研究背景与意义	第7-8页
·研究现状	第8-9页
·国外研究现状	第8页
·国内研究现状	第8-9页
·本文主要工作与结构	第9-10页
·本章小结	第10-11页
第二章 Spark计算平台	第11-19页
·Spark简介与架构	第11-14页
·Spark编程模型	第14-16页
·RDD弹性分布式数据集	第14-16页
·共享变量	第16页
·Spark工作原理	第16-17页
·Spark平台中算法并行化基础概念	第17-18页
·Scala语言编程	第17-18页
·算法并行化概念	第18页
·发挥RDD作用	第18页
·本章小结	第18-19页
第三章决策树算法	第19-24页
·决策树算法模型	第19-20页
·决策树算法的比较	第20-21页
·分裂属性的标准及其评价准则	第21-23页
·分裂属性的标准	第21-22页
·评价准则	第22-23页
·本章小结	第23-24页
第四章 CHAID算法的改进及其并行化	第24-35页
·CHAID算法思想	第24-25页
·CHAID算法的改进思想	第25-26页
·CHAID算法优点及与ID3、C4.5 的比较	第25-26页
·CHAID算法缺点及其改进	第26页
·FCHAID算法	第26-29页
·FCHAID算法	第26-29页
·FCHAID算法与Logistic回归辅助检验	第29页
·FCHAID算法与CHAID算法复杂度分析	第29页
·FCHAID算法并行性分析及其Spark实现	第29-31页
·分区策略	第29-30页
·合并策略	第30页
·数据并行的Spark实现	第30-31页
·实验数据及结果与分析	第31-34页
·实验数据	第31-32页
·实验结果与分析	第32-34页
·本章小结	第34-35页
第五章 FCHAID算法在信用风险分析中的应用	第35-43页
·数据预处理	第35-37页
·算法效果比较	第37-38页
·模型分析及结论	第38-42页
·本章小结	第42-43页
第六章总结与展望	第43-44页
·总结	第43页
·展望	第43-44页
致谢	第44-45页
参考文献	第45-48页
作者简介	第48页
攻读硕士学位期间研究成果	第48页