摘要 | 第8-9页 |
ABSTRACT | 第9页 |
第一章 绪论 | 第10-24页 |
1.1 课题来源 | 第10页 |
1.2 背景知识 | 第10-11页 |
1.2.1 全基因组研究的历史及意义 | 第10-11页 |
1.2.2 全基因组序列分析的整体流程 | 第11页 |
1.3 相关工作 | 第11-22页 |
1.3.1 基因组测序 | 第12-13页 |
1.3.2 基因组组装 | 第13-16页 |
1.3.3 序列比对 | 第16-19页 |
1.3.4 RNA编辑位点识别 | 第19-22页 |
1.4 本文的主要工作 | 第22-23页 |
1.5 本文的组织结构 | 第23-24页 |
第二章 大规模全基因组序列BWT索引构建并行优化 | 第24-34页 |
2.1 组装软件SGA的热点分析 | 第24-26页 |
2.2 当前大规模序列集合BWT索引的构建算法 | 第26-28页 |
2.2.1 预备知识 | 第26页 |
2.2.2 BWT的串行构建方法 | 第26-27页 |
2.2.3 BWT的并行构建方法 | 第27-28页 |
2.3 BWT构建深度并行方案设计与实现 | 第28-31页 |
2.3.1 BWTCP的设计思想 | 第28页 |
2.3.2 后缀分区 | 第28-29页 |
2.3.3 并行排序 | 第29-30页 |
2.3.4 剪枝策略 | 第30-31页 |
2.3.5 深度并行 | 第31页 |
2.4 BWTCP的性能评估 | 第31-33页 |
2.4.1 复杂性分析 | 第31-32页 |
2.4.2 实验设置 | 第32页 |
2.4.3 时间和内存开销 | 第32页 |
2.4.4 序列长度对性能的影响 | 第32-33页 |
2.5 本章小结 | 第33-34页 |
第三章 基于Intel MIC的高通量短序列并行比对软件开发 | 第34-43页 |
3.1 Intel MIC众核协处理器与天河二号超级计算机 | 第34-36页 |
3.1.1 Intel MIC众核协处理器 | 第34页 |
3.1.2 天河二号超级计算机 | 第34-36页 |
3.1.3 序列比对软件SOAP3-dp和BWA-MEM | 第36页 |
3.2 MICA的设计方案 | 第36-40页 |
3.2.1 面前天河二号节点设计的并行IO策略 | 第37页 |
3.2.2 面向MIC卡设计的并行比对策略 | 第37-39页 |
3.2.3 面向MIC卡512位宽向量的性能优化 | 第39-40页 |
3.3 MICA的性能评估 | 第40-41页 |
3.3.1 MICA与同类软件的性能比较 | 第40-41页 |
3.3.2 MICA在天河二号上的测试 | 第41页 |
3.4 本章小结 | 第41-43页 |
第四章 基于高通量序列比对的RNA编辑位点识别模型 | 第43-51页 |
4.1 当前RNA编辑识别流程分析 | 第43-46页 |
4.1.1 RNA序列比对 | 第43页 |
4.1.2 序列去重 | 第43-45页 |
4.1.3 变异位点查询 | 第45页 |
4.1.4 已知变异过滤 | 第45-46页 |
4.1.5 其他过滤条件 | 第46页 |
4.2 基于高通量序列比对的RNA编辑位点识别模型 | 第46-48页 |
4.3 性能评估 | 第48-49页 |
4.3.1 实验设置 | 第48页 |
4.3.2 比对软件选择对RNA编辑检测的影响 | 第48页 |
4.3.3 RED模型的准确度 | 第48-49页 |
4.4 本章小结 | 第49-51页 |
第五章 结束语 | 第51-53页 |
5.1 工作总结 | 第51-52页 |
5.2 研究展望 | 第52-53页 |
致谢 | 第53-55页 |
参考文献 | 第55-58页 |
作者在学期间取得的学术成果 | 第58页 |