基于Hadoop的全基因组关联研究系统设计与实现
摘要 | 第1-4页 |
ABSTRACT | 第4-8页 |
第一章 绪论 | 第8-12页 |
·研究背景 | 第8-10页 |
·研究目的与内容 | 第10页 |
·论文结构 | 第10-12页 |
第二章 相关知识 | 第12-23页 |
·GWAS 相关知识 | 第12-15页 |
·基本概念 | 第12-14页 |
·重要项目 | 第14-15页 |
·Hadoop 平台介绍 | 第15-22页 |
·Hadoop 架构 | 第15-16页 |
·HDFS 分布式文件系统 | 第16-17页 |
·MapReduce 分布式计算模型 | 第17-20页 |
·Hadoop Streaming | 第20-22页 |
·本章小结 | 第22-23页 |
第三章 系统组成与原理 | 第23-33页 |
·CloudAssoc 总体结构 | 第23-24页 |
·数据预处理模块 | 第24-26页 |
·数据预处理流程 | 第24-25页 |
·输入文件 | 第25页 |
·质量控制 | 第25-26页 |
·基因填补模块 | 第26-29页 |
·基因填补原理 | 第26-28页 |
·基因填补流程 | 第28-29页 |
·关联分析模块 | 第29-32页 |
·关联分析方法 | 第29-30页 |
·关联分析流程 | 第30-31页 |
·输出数据 | 第31-32页 |
·本章小结 | 第32-33页 |
第四章 软件并行化实现 | 第33-42页 |
·软件并行化方法研究 | 第33-34页 |
·IMPUTE2 的基本模型 | 第34-37页 |
·HMM | 第34-36页 |
·IMPUTE2 的算法 | 第36-37页 |
·IMPUTE2 的并行化实现 | 第37-41页 |
·数据分割 | 第37-39页 |
·数据存储 | 第39页 |
·软件并行化实现 | 第39-41页 |
·SNPTESTv2 的并行化实现 | 第41页 |
·本章小结 | 第41-42页 |
第五章 实验与结果分析 | 第42-55页 |
·实验目的 | 第42页 |
·实验环境 | 第42-43页 |
·实验数据准备 | 第43-47页 |
·参考组数据获得 | 第43-45页 |
·研究组数据获得 | 第45-47页 |
·实验内容与结果分析 | 第47-54页 |
·可扩展性测试 | 第47-50页 |
·数据处理高效性测试 | 第50-52页 |
·软件加速性能与数据分割窗口大小的关系测试 | 第52-53页 |
·系统整体流程可行性测试 | 第53-54页 |
·本章小结 | 第54-55页 |
第六章 总结与展望 | 第55-57页 |
·总结 | 第55页 |
·展望 | 第55-57页 |
参考文献 | 第57-60页 |
发表论文和参加科研情况说明 | 第60-61页 |
致谢 | 第61页 |