中文摘要 | 第3-4页 |
Abstract | 第4-5页 |
第一章 引言 | 第10-21页 |
1 研究背景 | 第12-19页 |
1.1 基于特征选择的异常值检测 | 第12-15页 |
1.2 基于稀疏化方法的Rodriguez&Laio (RL)聚类方法及应用 | 第15-17页 |
1.3 高维Ⅱ-型逐阶删失数据Cox比例风险模型的变量选择 | 第17-19页 |
2 研究内容及章节安排 | 第19-21页 |
第二章 高维数据降维方法简述 | 第21-32页 |
1 基于系数压缩的变量选择-回归问题 | 第21-23页 |
2 稀疏主成分分析与变量选择-无监督学习 | 第23-27页 |
3 基于标准互信息的降维方法(NMIFS, Normalized Mutual informationbased feature selection) | 第27-30页 |
4 高维数据可视化的t-SNE方法 | 第30-32页 |
4.1 t-SNE方法 | 第30-32页 |
第三章 基于特征选择的有监督分类器中异常值检测 | 第32-45页 |
1 基于特征选择的异常值检测 | 第32-33页 |
2 理论分析 | 第33-38页 |
2.1 矩阵ZTZ可逆的情形 | 第35-38页 |
2.2 高维情形 | 第38页 |
3 低维数据异常值的检测-模拟实验与实证分析 | 第38-43页 |
3.1 模拟实验 | 第38-41页 |
3.2 实证分析-鸢尾花卉数据集 | 第41-43页 |
4 高维数据异常值的检测-DBWorld e-mails数据 | 第43-45页 |
第四章 基于稀疏化方法的Rodriguez&Laio (RL)聚类方法及应用 | 第45-62页 |
1 Rodriguez and Laio (RL)算法 | 第45-46页 |
2 聚类效果评价方法 | 第46-48页 |
3 RL算法在数据流聚类中的应用 | 第48-54页 |
3.1 应用于流数据的FStream算法 | 第50页 |
3.2 数值模拟分析 | 第50-53页 |
3.3 实证分析 | 第53-54页 |
4 基于稀疏化主成分分析降维的RL聚类方法 | 第54-62页 |
4.1 数字模拟分析 | 第57-58页 |
4.2 实证分析-Olivetti人脸数据 | 第58-62页 |
第五章 Ⅱ-型逐阶删失数据半参数Cox比例风险模型的变量选择 | 第62-73页 |
1 部分似然函数及半参数估计 | 第62-64页 |
2 基于LASSO和逐项筛选的变量选择方法 | 第64-66页 |
2.1 LASSO型惩罚似然函数下的变量选择 | 第65页 |
2.2 逐项筛选方法 | 第65-66页 |
3 数值模拟及实证分析 | 第66-72页 |
3.1 变量选择 | 第66-67页 |
3.2 灵敏度分析 | 第67-69页 |
3.3 LASSO型变量选择方法和逐项筛选方法的比较 | 第69-70页 |
3.4 实证分析一: 退伍军人管理局肺癌试验 | 第70-71页 |
3.5 实证分析二: 原发性胆汁性肝硬化数据 | 第71-72页 |
4 小结 | 第72-73页 |
第六章 总结与展望 | 第73-76页 |
参考文献 | 第76-87页 |
在校期间科研成果 | 第87-88页 |
致谢 | 第88-89页 |