摘要 | 第1-3页 |
ABSTRACT | 第3-6页 |
第1章 绪论 | 第6-13页 |
·DNA 基因芯片数据分析的意义 | 第6-8页 |
·DNA 基因芯片数据分析的内容与现状 | 第8-11页 |
·癌症特征基因选择 | 第9-10页 |
·癌症诊断与分类 | 第10-11页 |
·本文研究的内容 | 第11-13页 |
第2章 DNA 数据获取与预处理 | 第13-19页 |
·基因芯片数据的获取 | 第13-16页 |
·寡核苷酸基因芯片 | 第14-15页 |
·cDNA 基因芯片 | 第15-16页 |
·本研究所用的常用基因芯片数据 | 第16-17页 |
·基因芯片数据的预处理 | 第17-18页 |
本章小结 | 第18-19页 |
第3章 基于有监督奇异值分解和类随机森林决策方法的特征基因提取方法 | 第19-37页 |
·奇异值分解理论 | 第19-22页 |
·奇异值分解的定义 | 第19-20页 |
·奇异值分解的性质 | 第20-22页 |
·基因芯片数据的有监督奇异值分解(SSVD) | 第22-25页 |
·科尔莫诺夫-斯米尔诺夫检验 | 第22-24页 |
·基因芯片数据的奇异值分解 | 第24-25页 |
·基于相对重要性的随机森林决策方法 | 第25-35页 |
·分类器和分类器组合 | 第25-27页 |
·分类问题及分类器 | 第25-26页 |
·分类器组合 | 第26-27页 |
·决策树简介 | 第27-28页 |
·分类回归树 | 第28-29页 |
·装袋(Bagging)方法 | 第29-30页 |
·随机森林 | 第30-33页 |
·随机森林的定义 | 第30页 |
·随机森林算法 | 第30-31页 |
·随机森林的泛化误差 | 第31-32页 |
·OOB 估计 | 第32-33页 |
·随机森林方法的优点 | 第33页 |
·基于相对重要性的类随机森林决策方法 | 第33-35页 |
·有监督奇异值分解(SSVD)和基于相对重要性的类随机森林决策的混合方法(SSVDRF) | 第35-36页 |
本章小结 | 第36-37页 |
第4章 SSVDRF 基因选择方法评估及分析 | 第37-51页 |
·基于散点图的肿瘤类别关联性分析 | 第37-40页 |
·分类性能的比较 | 第40-49页 |
·分类器 | 第40-43页 |
·K-最近邻分类算法 | 第40-41页 |
·朴素贝叶斯分类器 | 第41-42页 |
·支持向量机(SVM) | 第42-43页 |
·随机森林分类算法 | 第43页 |
·经典基因选择方法简介 | 第43-45页 |
·T-test 方法 | 第43-44页 |
·SVM-RFE 方法 | 第44-45页 |
·Permutation Test 简介 | 第45-46页 |
·前50 个特征基因分类率的比较 | 第46页 |
·分类率显著性差异比较 | 第46-47页 |
·与其他研究结果的比较 | 第47-49页 |
·基因稳定度的比较 | 第49-50页 |
本章小结 | 第50-51页 |
第5章 基因选择结果的生物学意义 | 第51-60页 |
·三个生物学数据库的简介 | 第51-52页 |
·NCBI 数据库 | 第51页 |
·GeneCards 数据库 | 第51页 |
·GO 数据库 | 第51-52页 |
·白血病关键基因的生物学意义 | 第52-54页 |
·结肠癌关键基因的生物学意义 | 第54-57页 |
·前列腺癌关键基因的生物学意义 | 第57-59页 |
本章小结 | 第59-60页 |
总结 | 第60-62页 |
致谢 | 第62-63页 |
参考文献 | 第63-71页 |
附录1 前列腺癌前50 个特征基因 | 第71-75页 |
附录2 | 第75页 |