摘要 | 第10-12页 |
英文摘要 | 第12-14页 |
1 前言 | 第15-33页 |
1.1 全基因组关联分析的目标与意义 | 第15-16页 |
1.2 GWAS模型的发展历程 | 第16-18页 |
1.3 关联分析模型 | 第18-23页 |
1.3.1 一般线性回归模型 | 第18页 |
1.3.2 混合线性模型 | 第18-19页 |
1.3.3 多位点加性效应模型 | 第19页 |
1.3.4 加性-显性效应模型 | 第19-21页 |
1.3.5 多遗传效应模型 | 第21页 |
1.3.6 两位点互作效应模型 | 第21-22页 |
1.3.7 多性状模型以及基因型与环境互作模型 | 第22页 |
1.3.8 模型间的比较 | 第22-23页 |
1.4 关联分析模型的应用 | 第23-24页 |
1.5 关联分析模型存在的问题及解决方案 | 第24-28页 |
1.5.1 群体结构对关联分析的影响 | 第24页 |
1.5.2 表型异质性 | 第24页 |
1.5.3 等位基因的异质性 | 第24-25页 |
1.5.4 P值膨胀 | 第25-27页 |
1.5.5 遗传力丢失 | 第27页 |
1.5.6 算法的时间复杂度 | 第27-28页 |
1.5.7 P值的阈值选择问题 | 第28页 |
1.6 基因组选择的目标及意义 | 第28页 |
1.7 基因组选择模型的发展历程 | 第28-29页 |
1.8 基因组选择在动植物育种中的应用 | 第29页 |
1.9 基因组选择的准确率 | 第29-31页 |
1.10 基因组选择存在问题与挑战 | 第31页 |
1.11 展望 | 第31页 |
1.12 本研究的目的与意义 | 第31-33页 |
2 实验材料与数据 | 第33-39页 |
2.1 酵母F_2群体 | 第33页 |
2.2 玉米巢式关联分析群体 | 第33-34页 |
2.3 真实数据 | 第34-38页 |
2.4 随机数据 | 第38页 |
2.5 模拟数据 | 第38页 |
2.6 数据来源 | 第38-39页 |
3 实验方法 | 第39-47页 |
3.1 表型模拟 | 第39页 |
3.2 一般线性模型(GLM) | 第39页 |
3.3 一般线性模型的替代模型 | 第39-40页 |
3.4 EM-Bayesian LASSO模型 | 第40页 |
3.5 BIC值计算 | 第40-41页 |
3.6 LD清除算法 | 第41页 |
3.7 HDGENE模型 | 第41-43页 |
3.8 R/QTL互作模型分析 | 第43页 |
3.9 遗传力的估计 | 第43-44页 |
3.10 交叉验证与准确率 | 第44页 |
3.11 基因组预测模型 | 第44-46页 |
3.12 Pearson相关系数校正 | 第46-47页 |
4 结果分析 | 第47-86页 |
4.1 对酵母F_2群体的分析 | 第47-56页 |
4.1.1 EM-Bayesian LASSO模型对酵母显著位点的分析 | 第47页 |
4.1.2 EM-Bayesian LASSO模型的Power | 第47-48页 |
4.1.3 HDGENE加性模型及与QTCAT模型的比较 | 第48-52页 |
4.1.4 HDGENE加性模型对酵母真实性状的分析 | 第52-53页 |
4.1.5 基因型的LD清除 | 第53-54页 |
4.1.6 不同性状加性效应QTNs的比较 | 第54页 |
4.1.7 HDGENE互作模型与R/QTL互作模型的比较 | 第54-56页 |
4.1.8 互作位点的效应值多为微效效应 | 第56页 |
4.2 玉米NAM群体的分析结果 | 第56-70页 |
4.2.1 表型的遗传力 | 第56-57页 |
4.2.2 HDGENE加性模型分析结果 | 第57-68页 |
4.2.3 HDGENE互作模型分析结果 | 第68-70页 |
4.3 基因组选择准确率的计算 | 第70-80页 |
4.3.1 训练群体均值和预测群体均值的人为负相关 | 第70-71页 |
4.3.2 Hold准确率的负向偏差 | 第71-72页 |
4.3.3 交叉验证倍数越多,Hold准确率偏差越大 | 第72-73页 |
4.3.4 Hold和Instant方法之间的预测准确率差异 | 第73-76页 |
4.3.5 Instant准确率存在的问题 | 第76-78页 |
4.3.6 Instant准确率的校正 | 第78-80页 |
4.4 iGS软件开发 | 第80-86页 |
4.4.1 模型选择 | 第80页 |
4.4.2 遗传参数的估计 | 第80页 |
4.4.3 软件的设计 | 第80页 |
4.4.4 输入文件格式 | 第80-81页 |
4.4.5 输出文件 | 第81-86页 |
5 讨论 | 第86-91页 |
5.1 研究数据的选择 | 第86页 |
5.2 HDGENE模型与其他模型的比较 | 第86页 |
5.3 EM-Bayesian LASSO的局限性 | 第86-87页 |
5.4 上位性效应的假阳性过高 | 第87页 |
5.5 基因组选择准确率的评估 | 第87页 |
5.6 零假设下Hold准确率的偏差 | 第87-88页 |
5.7 Hold和Instant准确率方法产生不同的结果 | 第88页 |
5.8 Hold准确率与Instant准确率相比偏低 | 第88页 |
5.9 Instant准确率的通用性 | 第88-89页 |
5.10 Instant准确率的校正 | 第89页 |
5.11 避免使用Jackknife | 第89页 |
5.12 本研究的局限性 | 第89-91页 |
6 结论 | 第91-92页 |
致谢 | 第92-93页 |
参考文献 | 第93-106页 |
附录 | 第106-119页 |
攻读博士学位期间发表的学术论文 | 第119页 |