摘要 | 第5-7页 |
Abstract | 第7-9页 |
第1章 绪论 | 第13-36页 |
1.1 研究背景及意义 | 第13-14页 |
1.2 国内外研究现状 | 第14-32页 |
1.2.1 模式分类的研究现状 | 第14-15页 |
1.2.2 小样本问题分类研究现状 | 第15-25页 |
1.2.3 不平衡数据分类研究现状 | 第25-28页 |
1.2.4 协方差偏移下的分类问题研究现状 | 第28-30页 |
1.2.5 大规模数据分类快速算法 | 第30-32页 |
1.3 主要研究内容 | 第32-33页 |
1.4 论文组织结构 | 第33-36页 |
第2章 面向小样本分类的训练样本集构造方法研究 | 第36-50页 |
2.1 引言 | 第36页 |
2.2 分类问题的表示 | 第36-38页 |
2.3 小样本分类问题理论 | 第38-42页 |
2.3.1 函数集容量理论 | 第38-39页 |
2.3.2 风险泛函的界 | 第39-41页 |
2.3.3 结构风险最小化理论 | 第41页 |
2.3.4 小样本分类问题 | 第41-42页 |
2.4 虚拟样本相关基础研究 | 第42-43页 |
2.4.1 相关定义 | 第42页 |
2.4.2 现有虚拟样本生成方法的不足 | 第42-43页 |
2.5 基于高斯分布的虚拟样本生成方法 | 第43-45页 |
2.5.1 基本思想 | 第43页 |
2.5.2 参数估计 | 第43-44页 |
2.5.3 虚拟样本生成过程 | 第44页 |
2.5.4 基于高斯分布虚拟样本生成的小样本扩充算法 | 第44-45页 |
2.6 理论证明 | 第45-47页 |
2.7 实验 | 第47-49页 |
2.7.1 iris 数据集上的小样本分类实验 | 第47-48页 |
2.7.2 灵敏性分析 | 第48-49页 |
2.8 本章小结 | 第49-50页 |
第3章 面向不平衡分类的训练样本集构造方法研究 | 第50-62页 |
3.1 引言 | 第50页 |
3.2 不平衡数据分类问题基础研究 | 第50-54页 |
3.2.1 不平衡数据分类的评价准则 | 第50-51页 |
3.2.2 SMOTE 算法 | 第51-52页 |
3.2.3 代价敏感学习算法 | 第52-54页 |
3.3 基于高斯分布虚拟样本生成的不平衡数据分类算法研究 | 第54-57页 |
3.3.1 算法 | 第54-55页 |
3.3.2 理论证明 | 第55-57页 |
3.4 实验 | 第57-61页 |
3.4.1 网络入侵检测数据集上的不平衡数据分类 | 第57-60页 |
3.4.2 灵敏性分析 | 第60-61页 |
3.5 本章小结 | 第61-62页 |
第4章 面向协方差偏移分类的训练样本集构造方法研究 | 第62-77页 |
4.1 引言 | 第62页 |
4.2 相关基础研究 | 第62-67页 |
4.2.1 TrAdaBoost 算法 | 第62-67页 |
4.3 极大一致分布子集构造方法 | 第67-69页 |
4.3.1 极大一致分布子集定义 | 第67页 |
4.3.2 极大一致分布子集构造方法 | 第67-68页 |
4.3.3 极大一致分布子集构造算法描述及复杂度分析 | 第68-69页 |
4.4 基于构造 MIDS 的协方差偏移下的分类方法 | 第69-72页 |
4.4.1 情况 1 下的 MIDS 构造方法 | 第69-70页 |
4.4.2 情况 2 下的 MIDS 构造方法 | 第70-71页 |
4.4.3 分类算法 | 第71-72页 |
4.5 实验 | 第72-76页 |
4.5.1 情况 1 上的实验 | 第72-74页 |
4.5.2 情况 2 上的实验 | 第74-76页 |
4.6 本章小结 | 第76-77页 |
第5章 面向大规模数据分类的训练样本集构造方法研究 | 第77-100页 |
5.1 引言 | 第77页 |
5.2 支持向量机理论分析 | 第77-83页 |
5.2.1 KKT 条件及核的 Mercer 条件 | 第78-79页 |
5.2.2 最优超平面 | 第79-80页 |
5.2.3 支持向量机求解 | 第80-83页 |
5.3 一种基于投影的支持向量预选取方法 | 第83-89页 |
5.3.1 支持向量与边界样本集的关系 | 第83-84页 |
5.3.2 投影原因及投影直线的特征分析 | 第84页 |
5.3.3 投影直线确定方法 | 第84-88页 |
5.3.4 支持向量预选取过程中的核参数选择 | 第88-89页 |
5.4 边界向量集抽取 | 第89-92页 |
5.4.1 如何区分线性可分情况与非线性可分情况 | 第89页 |
5.4.2 线性可分问题下的边界向量抽取 | 第89-90页 |
5.4.3 非线性可分问题下的边界向量抽取 | 第90-92页 |
5.4.4 如何选择合适的参数λ | 第92页 |
5.5 时空复杂度分析 | 第92-95页 |
5.5.1 线性可分情况 | 第92-93页 |
5.5.2 非线性可分情况 | 第93-95页 |
5.6 仿真实验 | 第95-99页 |
5.6.1 线性可分问题实例 | 第95-97页 |
5.6.2 非线性可分问题实例 | 第97-98页 |
5.6.3 网络入侵检测问题实例 | 第98-99页 |
5.7 本章小结 | 第99-100页 |
结论 | 第100-102页 |
参考文献 | 第102-110页 |
攻读博士学位期间发表的论文和取得的科研成果 | 第110-111页 |
致谢 | 第111页 |