摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第一章 绪论 | 第10-15页 |
1.1 研究背景与意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-13页 |
1.3 本文的研究内容 | 第13-14页 |
1.4 本文的组织结构 | 第14-15页 |
第二章 贝叶斯网络分类器概述 | 第15-31页 |
2.1 理论基础 | 第15-19页 |
2.1.1 概率论基础 | 第15-16页 |
2.1.2 信息论基础 | 第16-19页 |
2.2 贝叶斯网络分类器 | 第19-24页 |
2.2.1 贝叶斯网络概述 | 第19-21页 |
2.2.2 贝叶斯网络结构学习 | 第21-22页 |
2.2.3 树增强朴素贝叶斯 | 第22-24页 |
2.3 算法评估标准介绍 | 第24-30页 |
2.3.1 性能评价标准 | 第25-28页 |
2.3.2 分类准确率评价方法 | 第28-30页 |
2.4 本章小结 | 第30-31页 |
第三章 基于改进BIC评分函数的TAN分类器学习 | 第31-45页 |
3.1 问题描述 | 第31-32页 |
3.2 STAN模型 | 第32-34页 |
3.2.1 BIC评分函数 | 第32-33页 |
3.2.2 STAN模型 | 第33-34页 |
3.3 SETAN模型 | 第34-38页 |
3.3.1 理论分析 | 第34-35页 |
3.3.2 改进BIC评分函数 | 第35页 |
3.3.3 模型描述 | 第35-37页 |
3.3.4 算法描述 | 第37-38页 |
3.3.5 时间复杂度分析 | 第38页 |
3.4 实验结果与分析 | 第38-43页 |
3.4.1 BIC评分函数惩罚系数估计 | 第38-39页 |
3.4.2 SETAN模型分类性能评估 | 第39-43页 |
3.5 本章小结 | 第43-45页 |
第四章 基于Spark平台的SETAN算法的并行化 | 第45-60页 |
4.1 Spark平台概述 | 第45-48页 |
4.1.1 Spark框架简介 | 第45-46页 |
4.1.2 Spark执行原理 | 第46-47页 |
4.1.3 Spark性能优势 | 第47-48页 |
4.2 SETAN并行化设计 | 第48-52页 |
4.2.1 并行化理论基础 | 第48-49页 |
4.2.2 并行化设计方案 | 第49-52页 |
4.3 实验结果与分析 | 第52-59页 |
4.3.1 实验环境及数据 | 第52-53页 |
4.3.2 资源优化 | 第53-55页 |
4.3.3 分类准确率分析 | 第55页 |
4.3.4 时间开销分析 | 第55-57页 |
4.3.5 加速比、数据伸缩率、可扩展性分析 | 第57-59页 |
4.4 本章小结 | 第59-60页 |
第五章 结论 | 第60-62页 |
5.1 总结 | 第60-61页 |
5.2 展望 | 第61-62页 |
参考文献 | 第62-66页 |
致谢 | 第66-67页 |
附录 (攻读硕士期间发表论文目录) | 第67页 |