摘要 | 第5-6页 |
abstract | 第6页 |
第一章 绪论 | 第9-17页 |
1.1 研究背景和意义 | 第9-10页 |
1.2 国内外研究现状 | 第10-16页 |
1.2.1 预测聚类树算法 | 第10-12页 |
1.2.2 随机森林算法 | 第12-13页 |
1.2.3 多类标分类 | 第13-16页 |
1.3 本文的主要工作 | 第16页 |
1.4 本文的组织结构 | 第16-17页 |
第二章 多类标分类相关知识 | 第17-21页 |
2.1 多类标分类基础知识 | 第17页 |
2.1.1 多类标分类的定义 | 第17页 |
2.2 多类标分类效果评判指标 | 第17-20页 |
2.2.1 二值评判指标 | 第18-19页 |
2.2.2 排序评判指标 | 第19-20页 |
2.3 本章小结 | 第20-21页 |
第三章 基于随机森林和预测聚类树的算法 | 第21-33页 |
3.1 将多类标数据转化成网络图 | 第23-24页 |
3.2 权重矩阵计算 | 第24页 |
3.3 预测聚类树的构建 | 第24-27页 |
3.3.1 生成随机属性集 | 第26页 |
3.3.2 生成随机属性集对应的阈值序列 | 第26-27页 |
3.3.3 获得最优分裂属性值和阈值后分裂 | 第27页 |
3.3.4 停止分裂 | 第27页 |
3.4 预测聚类树的构建过程中的属性选择 | 第27-30页 |
3.4.1 计算紧密度 | 第27-28页 |
3.4.2 计算聚类间的距离 | 第28页 |
3.4.3 寻找最优分裂属性和对应阈值 | 第28-30页 |
3.5 与随机森林算法的集成 | 第30页 |
3.5.1 随机森林的构建 | 第30页 |
3.5.2 随机森林集成预测聚类树后生成测试结果 | 第30页 |
3.6 算法时间复杂度 | 第30-31页 |
3.7 本章小结 | 第31-33页 |
第四章 算法实验分析 | 第33-53页 |
4.1 实验环境介绍 | 第33-34页 |
4.1.1 Mulan(A Java Library for Multi-label Learning) | 第33页 |
4.1.2 Weka(Waikato Environment for Knowledge Analysis) | 第33-34页 |
4.2 实验数据集 | 第34-35页 |
4.3 算法对比指标 | 第35页 |
4.4 对比算法简介 | 第35页 |
4.5 本算法实验过程 | 第35-37页 |
4.5.1 调整树的数目 | 第35-36页 |
4.5.2 调整随机抽取属性的数目 | 第36-37页 |
4.5.3 调整确定类标的阈值 | 第37页 |
4.6 实验结果与分析 | 第37-52页 |
4.6.1 二值评判指标 | 第38-48页 |
4.6.2 排序评判指标 | 第48-52页 |
4.6.3 实验结果分析 | 第52页 |
4.7 本章小结 | 第52-53页 |
第五章 结论 | 第53-55页 |
参考文献 | 第55-58页 |
攻读硕士学位期间取得的研究成果 | 第58-59页 |
致谢 | 第59-60页 |
附件 | 第60页 |