关于遗传性疾病和性状相关联的单核苷酸多态性特征研究
摘要 | 第4-5页 |
Abstract | 第5页 |
第一章 概述 | 第10-20页 |
1.1 引言 | 第10-16页 |
1.1.1 全基因组关联研究 | 第10-15页 |
1.1.2 单核苷酸多态性 | 第15-16页 |
1.2 GWAS在人类复杂疾病中的应用 | 第16-17页 |
1.3 本文的工作和组织框架 | 第17-20页 |
第二章 基因数据的获取与预处理 | 第20-26页 |
2.1 基于等位基因频率的映射 | 第20-21页 |
2.2 SNP位点的质量控制 | 第21-23页 |
2.2.1 最小等位基因频率控制(MAF) | 第22页 |
2.2.2 Hardy-Weinberg平衡控制 | 第22-23页 |
2.3 本章小结 | 第23-26页 |
第三章 单位点关联性检测 | 第26-38页 |
3.1 卡方检验 | 第26-28页 |
3.2 逻辑回归 | 第28-31页 |
3.2.1 基本原理 | 第28-29页 |
3.2.2 具体过程 | 第29-31页 |
3.2.3 梯度下降法 | 第31页 |
3.3 致病SNP识别方法性能比较 | 第31-36页 |
3.3.1 实验结果分析 | 第32-35页 |
3.3.2 Bonferroni校正 | 第35-36页 |
3.4 本章小结 | 第36-38页 |
第四章 基于随机森林的致病SNP检测 | 第38-58页 |
4.1 随机森林综述 | 第38-40页 |
4.2 随机森林 | 第40-52页 |
4.2.1 CART | 第40-43页 |
4.2.2 随机森林的构建 | 第43-45页 |
4.2.3 变量重要性 | 第45-48页 |
4.2.4 偏差 | 第48-49页 |
4.2.5 不同参数对随机森林的影响 | 第49-52页 |
4.3 实验结果与分析 | 第52-56页 |
4.4 本章小结 | 第56-58页 |
第五章 与疾病性状关联的位点检测 | 第58-68页 |
5.1 metaCCA算法 | 第59-63页 |
5.2 实验结果分析 | 第63-66页 |
5.3 本章小结 | 第66-68页 |
第六章 总结与展望 | 第68-70页 |
参考文献 | 第70-76页 |
致谢 | 第76-78页 |
硕士期间发表的学术论文及获奖情况 | 第78页 |