摘要 | 第4-7页 |
abstract | 第7-9页 |
第一章 绪论 | 第13-19页 |
1.1 课题研究背景和意义 | 第13-16页 |
1.2 本文主要研究内容 | 第16-17页 |
1.3 本文的结构框架 | 第17-19页 |
第二章 组学数据及标志物检测相关问题 | 第19-25页 |
2.1 生物大数据概述 | 第19-22页 |
2.1.1 转录组数据 | 第19-20页 |
2.1.2 蛋白质组数据 | 第20-21页 |
2.1.3 甲基化组数据 | 第21-22页 |
2.2 生物标志物检测发展现状 | 第22-23页 |
2.3 基于组学数据建模挑战性问题 | 第23-25页 |
第三章 健康大数据挖掘算法 | 第25-43页 |
3.1 特征选择算法 | 第25-34页 |
3.1.1 特征选择概述 | 第25-27页 |
3.1.2 特征选择分类 | 第27-29页 |
3.1.3 几种常见的特征选择算法 | 第29-34页 |
3.2 机器学习算法 | 第34-43页 |
3.2.1 统计学习方法 | 第34-38页 |
3.2.2 分类问题 | 第38-40页 |
3.2.3 回归问题 | 第40-43页 |
第四章 肺癌发展分期蛋白标志物识别 | 第43-57页 |
4.1 本章提要 | 第43页 |
4.2 研究背景 | 第43-45页 |
4.3 数据和方法 | 第45-49页 |
4.3.1 两种肺癌亚型的组学数据集 | 第45-46页 |
4.3.2 本文的计算流程 | 第46-48页 |
4.3.3 模型评估方法 | 第48-49页 |
4.4 结果和讨论 | 第49-55页 |
4.4.1 数据预处理 | 第49-50页 |
4.4.2 SVM-RFE选择特征的个数 | 第50-51页 |
4.4.3 物稀为贵的蛋白标志物 | 第51-52页 |
4.4.4 其他组学数据的比较分析 | 第52-53页 |
4.4.5 从选定标志物获得两种亚型的生物理解 | 第53-55页 |
4.5 本章小结 | 第55-57页 |
第五章 肾透明细胞癌发展分期甲基化标志物性别特异性研究 | 第57-71页 |
5.1 本章提要 | 第57页 |
5.2 研究背景 | 第57-58页 |
5.3 数据和方法 | 第58-60页 |
5.3.1 数据集简介 | 第58-59页 |
5.3.2 分类性能评估 | 第59页 |
5.3.3 特征选择算法评估 | 第59-60页 |
5.3.4 分类算法评估 | 第60页 |
5.4 结果和讨论 | 第60-70页 |
5.4.1 基于T检验的递增特征选择以及SVM分类 | 第61-62页 |
5.4.2 分类器性能差异分析 | 第62-64页 |
5.4.3 不同特征选择算法分析 | 第64-67页 |
5.4.4 基于TriVote特征选择的LR模型 | 第67-69页 |
5.4.5 两种性别特异模型的交叉验证 | 第69-70页 |
5.5 本章小结 | 第70-71页 |
第六章 总结和展望 | 第71-73页 |
6.1 研究总结 | 第71-72页 |
6.2 未来展望 | 第72-73页 |
参考文献 | 第73-87页 |
作者简介及在学期间所取得的科研成果 | 第87-89页 |
致谢 | 第89页 |