摘要 | 第8-10页 |
Abstract | 第10-11页 |
1 绪论 | 第12-22页 |
1.1 研究意义及背景 | 第12-13页 |
1.2 国内外研究现状 | 第13-19页 |
1.2.1 全基因组选择方法 | 第14-18页 |
1.2.2 全基因组测序数据处理方法 | 第18-19页 |
1.3 研究目的 | 第19-20页 |
1.4 研究创新点 | 第20-22页 |
2 材料与方法 | 第22-50页 |
2.1 数据介绍 | 第22-28页 |
2.1.1 基因组选择测试数据 | 第22-26页 |
2.1.2 表型数据模拟 | 第26页 |
2.1.3 fasta参考基因组及fastq测序数据 | 第26-28页 |
2.2 表型预测方法体系构建 | 第28-31页 |
2.2.1 表型预测方法设计 | 第28页 |
2.2.2 测序数据处理管道建立 | 第28页 |
2.2.3 整合数据处理管道与预测方法体系 | 第28-31页 |
2.3 基于数据挖据的表型预测方法研究 | 第31-37页 |
2.3.1 mMAP设计 | 第34页 |
2.3.2 数据挖掘算法 | 第34-36页 |
2.3.3 收敛方法设计 | 第36-37页 |
2.4 基因组预测准确度计算 | 第37-40页 |
2.5 数据处理管道优化研究 | 第40-44页 |
2.5.1 参考基因组fasta转换HDF5 | 第40页 |
2.5.2 双索引文件的设计 | 第40页 |
2.5.3 基因型数据压缩 | 第40-42页 |
2.5.4 基因型数据还原处理 | 第42-43页 |
2.5.5 基因型数据转换 | 第43-44页 |
2.6 云计算平台搭建 | 第44-50页 |
2.6.1 WEB平台设计 | 第46-47页 |
2.6.2 Docker容器搭建 | 第47-50页 |
3 m MAP结果和分析 | 第50-75页 |
3.1 mMAP设置 | 第50-60页 |
3.1.1 聚类 | 第50-52页 |
3.1.2 初始聚类重复次数 | 第52页 |
3.1.3 收敛阈值 | 第52-55页 |
3.1.4 参数整合分析 | 第55-60页 |
3.2 mMAP在真实数据中的效果 | 第60-65页 |
3.2.1 玉米 | 第60-63页 |
3.2.2 大豆 | 第63页 |
3.2.3 小鼠 | 第63-65页 |
3.2.4 松树 | 第65页 |
3.3 mMAP在模拟数据中的效果 | 第65-75页 |
3.3.1 玉米 | 第66-71页 |
3.3.2 大豆 | 第71-72页 |
3.3.3 小鼠 | 第72-73页 |
3.3.4 松树 | 第73-75页 |
4 管道及体系构建结果和分析 | 第75-82页 |
4.1 测序数据处理管道的效果分析 | 第76-79页 |
4.1.1 HDF5参考基因组 | 第76-78页 |
4.1.2 双索引文件引用 | 第78页 |
4.1.3 gZIP压缩算法应用 | 第78-79页 |
4.2 方法体系效果 | 第79-82页 |
4.2.1 mMAP与管道整合 | 第79-80页 |
4.2.2 云计算平台的应用 | 第80-82页 |
5 基因组育种值计算和体系分析讨论 | 第82-87页 |
5.1 基因组育种值计算 | 第82-84页 |
5.1.1 mMAP计算基因组育种值 | 第82页 |
5.1.2 选种选育应用 | 第82-84页 |
5.2 预测方法体系分析讨论 | 第84-87页 |
5.2.1 mMAP预测表型数据策略 | 第85页 |
5.2.2 测序数据处理管道方法 | 第85-86页 |
5.2.3 整合管道和mMAP表型预测方法体系 | 第86-87页 |
6 结论与展望 | 第87-89页 |
6.1 结论 | 第87-88页 |
6.2 展望 | 第88-89页 |
致谢 | 第89-90页 |
参考文献 | 第90-99页 |
附录 | 第99-120页 |
攻读博士学位期间发表的学术论文 | 第120页 |