摘要 | 第5-7页 |
Abstract | 第7-9页 |
第1章 绪论 | 第14-36页 |
1.1 研究背景及意义 | 第14-16页 |
1.2 医学数据的特点 | 第16-17页 |
1.2.1 多样性和异质性 | 第16页 |
1.2.2 样本类别不平衡和内容不完整 | 第16页 |
1.2.3 特征高维性、冗余性和高度相关性 | 第16-17页 |
1.3 国内外研究现状 | 第17-31页 |
1.3.1 医学数据挖掘研究现状 | 第17-20页 |
1.3.2 特征选择技术研究现状 | 第20-24页 |
1.3.3 类别不平衡数据分类研究现状 | 第24-26页 |
1.3.4 随机森林算法研究现状 | 第26-31页 |
1.4 论文研究思路及主要研究内容 | 第31-33页 |
1.5 论文组织结构 | 第33-36页 |
第2章 面向类别不平衡数据集的RF分类算法研究 | 第36-60页 |
2.1 引言 | 第36-39页 |
2.2 概念定义 | 第39-41页 |
2.3 随机森林模型 | 第41-46页 |
2.3.1 随机森林的定义 | 第41页 |
2.3.2 随机森林的收敛性 | 第41-42页 |
2.3.3 随机森林的泛化误差上界 | 第42-44页 |
2.3.4 随机重采样技术 | 第44-45页 |
2.3.5 训练决策树 | 第45-46页 |
2.3.6 随机森林算法 | 第46页 |
2.4 面向类别不平衡数据集的RF分类算法BRF | 第46-50页 |
2.4.1 BRF算法设计 | 第46-48页 |
2.4.2 算法分析 | 第48-50页 |
2.5 实验及结果分析 | 第50-59页 |
2.5.1 实验设计 | 第50-51页 |
2.5.2 实验数据与参数设置 | 第51-52页 |
2.5.3 实验一结果及分析 | 第52-54页 |
2.5.4 实验二结果及分析 | 第54-55页 |
2.5.5 参数设置讨论 | 第55-59页 |
2.6 本章小结 | 第59-60页 |
第3章 基于RF的Filter式特征选择算法研究 | 第60-84页 |
3.1 引言 | 第60-61页 |
3.2 算法基础及相关工作 | 第61-71页 |
3.2.1 特征选择的概念 | 第61-62页 |
3.2.2 特征选择的分类 | 第62-65页 |
3.2.3 特征相关性度量 | 第65-67页 |
3.2.4 变量重要性分数 | 第67-69页 |
3.2.5 多元自适应回归样条MARS | 第69-71页 |
3.3 基于RF的Filter式特征选择算法 | 第71-74页 |
3.3.1 算法设计 | 第71-73页 |
3.3.2 算法分析 | 第73-74页 |
3.4 仿真实验及结果分析 | 第74-82页 |
3.4.1 实验数据及参数设定 | 第74页 |
3.4.2 特征选择与分类性能分析 | 第74-77页 |
3.4.3 参数设置分析 | 第77-80页 |
3.4.4 在糖尿病临床数据集上的结果分析 | 第80-82页 |
3.5 本章小结 | 第82-84页 |
第4章 基于RF的Wrapper式特征选择算法研究 | 第84-102页 |
4.1 引言 | 第84-85页 |
4.2 基于RF和GSBS的Wrapper式特征算法 | 第85-87页 |
4.2.1 算法设计 | 第85-86页 |
4.2.2 时间复杂度分析 | 第86-87页 |
4.3 RF-GSBS算法实验分析 | 第87-94页 |
4.3.1 实验数据与环境 | 第87-88页 |
4.3.2 评价函数的性能分析 | 第88页 |
4.3.3 特征选择过程分析 | 第88-92页 |
4.3.4 算法的有效性分析 | 第92-93页 |
4.3.5 参数L的设置讨论 | 第93-94页 |
4.4 基于RF的序列联合特征搜索策略 | 第94-97页 |
4.4.1 算法设计 | 第95-97页 |
4.4.2 时间复杂度分析 | 第97页 |
4.5 仿真实验及结果分析 | 第97-101页 |
4.5.1 实验数据集 | 第97-98页 |
4.5.2 UCI数据集和HYDD数据集上的实验 | 第98-100页 |
4.5.3 ALLb数据集上的实验 | 第100-101页 |
4.6 本章小结 | 第101-102页 |
第5章 面向微阵列表达数据的RF特征选择算法研究 | 第102-124页 |
5.1 引言 | 第102-103页 |
5.2 相关工作 | 第103-104页 |
5.3 面向微阵列表达数据的RF特征选择算法 | 第104-111页 |
5.3.1 基因过滤 | 第105-106页 |
5.3.2 分层特征搜索策略 | 第106-107页 |
5.3.3 特征子集评价函数 | 第107页 |
5.3.4 基于分层特征搜索策略的RF特征选择算法 | 第107-110页 |
5.3.5 算法的时间复杂度分析 | 第110-111页 |
5.4 实验分析 | 第111-122页 |
5.4.1 实验数据集 | 第111-113页 |
5.4.2 参数设置讨论 | 第113页 |
5.4.3 基因过滤结果 | 第113-114页 |
5.4.4 特征选择算法的性能比较 | 第114页 |
5.4.5 分层特征搜索策略的性能分析 | 第114-119页 |
5.4.6 特征子集评价算法研究 | 第119-122页 |
5.5 本章小结 | 第122-124页 |
结论 | 第124-126页 |
参考文献 | 第126-138页 |
攻读博士学位期间发表的论文和取得的科研成果 | 第138-139页 |
致谢 | 第139-140页 |
个人简历 | 第140页 |