基于Hadoop的全基因组关联研究系统设计与实现

摘要	第1-4页
ABSTRACT	第4-8页
第一章绪论	第8-12页
·研究背景	第8-10页
·研究目的与内容	第10页
·论文结构	第10-12页
第二章相关知识	第12-23页
·GWAS 相关知识	第12-15页
·基本概念	第12-14页
·重要项目	第14-15页
·Hadoop 平台介绍	第15-22页
·Hadoop 架构	第15-16页
·HDFS 分布式文件系统	第16-17页
·MapReduce 分布式计算模型	第17-20页
·Hadoop Streaming	第20-22页
·本章小结	第22-23页
第三章系统组成与原理	第23-33页
·CloudAssoc 总体结构	第23-24页
·数据预处理模块	第24-26页
·数据预处理流程	第24-25页
·输入文件	第25页
·质量控制	第25-26页
·基因填补模块	第26-29页
·基因填补原理	第26-28页
·基因填补流程	第28-29页
·关联分析模块	第29-32页
·关联分析方法	第29-30页
·关联分析流程	第30-31页
·输出数据	第31-32页
·本章小结	第32-33页
第四章软件并行化实现	第33-42页
·软件并行化方法研究	第33-34页
·IMPUTE2 的基本模型	第34-37页
·HMM	第34-36页
·IMPUTE2 的算法	第36-37页
·IMPUTE2 的并行化实现	第37-41页
·数据分割	第37-39页
·数据存储	第39页
·软件并行化实现	第39-41页
·SNPTESTv2 的并行化实现	第41页
·本章小结	第41-42页
第五章实验与结果分析	第42-55页
·实验目的	第42页
·实验环境	第42-43页
·实验数据准备	第43-47页
·参考组数据获得	第43-45页
·研究组数据获得	第45-47页
·实验内容与结果分析	第47-54页
·可扩展性测试	第47-50页
·数据处理高效性测试	第50-52页
·软件加速性能与数据分割窗口大小的关系测试	第52-53页
·系统整体流程可行性测试	第53-54页
·本章小结	第54-55页
第六章总结与展望	第55-57页
·总结	第55页
·展望	第55-57页
参考文献	第57-60页
发表论文和参加科研情况说明	第60-61页
致谢	第61页