摘要 | 第1-5页 |
ABSTRACT | 第5-12页 |
第1章 绪论 | 第12-20页 |
·研究背景 | 第12-16页 |
·流应用和流体系结构 | 第12页 |
·序列比对软件的流并行性 | 第12-14页 |
·序列比对软件的流并行化设计思路 | 第14-16页 |
·研究应用在CUDA 平台上映射方法的意义 | 第16-18页 |
·研究应用在CUDA 平台上的映射思路 | 第16页 |
·研究应用在CUDA 平台上的优化方法 | 第16-18页 |
·论文的研究目标和主要工作 | 第18-19页 |
·论文的结构 | 第19-20页 |
第2章 CUDA 编程模型与 CUDA 架构 | 第20-30页 |
·CUDA 编程模型 | 第20-21页 |
·CUDA 存储器模型 | 第21-24页 |
·多级存储器 | 第21-23页 |
·GPU 线程和多级存储器的关系 | 第23-24页 |
·CUDA 计算模型 | 第24-28页 |
·CUDA 执行模型和硬件映射 | 第24-26页 |
·CPU+GPU 异构平台 | 第26-28页 |
·小结 | 第28-30页 |
第3章 序列比对并行软件的平台适应性研究 | 第30-42页 |
·Smith-Waterman 算法的细粒度并行性开发 | 第30-37页 |
·Smith-Waterman 算法的OpenMP 实现 | 第30-31页 |
·Smith-Waterman 算法的OpenMP 平台上的适应性研究 | 第31-33页 |
·Smith-Waterman 算法的CUDA 实现 | 第33-35页 |
·Smith-Waterman 算法的CUDA 平台上的适应性研究 | 第35-37页 |
·GSW:CUDA 平台上的一种序列比对软件粗粒度并行实现 | 第37-38页 |
·序列比对并行软件GSW 在CUDA 平台上的适应性分析 | 第38-40页 |
·小结 | 第40-42页 |
第4章 序列比对并行软件在 CUDA 平台上的优化方案 | 第42-52页 |
·优化计算和访存 | 第42-45页 |
·负载平衡 | 第45-48页 |
·GPU 线程负载平衡 | 第45-46页 |
·CPU 和GPU 负载平衡 | 第46-48页 |
·划分原理和序列比对应用的结合 | 第48-50页 |
·灵活的线程组织方式 | 第50-51页 |
·小结 | 第51-52页 |
第5章 序列比对并行软件在 CUDA 上优化方案的性能评测 | 第52-68页 |
·评测环境和评测方法 | 第52页 |
·优化计算和访存对性能的影响 | 第52-56页 |
·性能影响因素 | 第52-54页 |
·评测结果 | 第54-56页 |
·负载平衡对性能的影响 | 第56-62页 |
·性能影响因素 | 第57页 |
·评测结果 | 第57-62页 |
·粗细粒度并行同时进行对性能的影响 | 第62-64页 |
·性能影响因素 | 第62-63页 |
·评测结果 | 第63-64页 |
·灵活的线程组织方式对性能的影响 | 第64-67页 |
·性能影响因素 | 第65页 |
·评测结果 | 第65-67页 |
·小结 | 第67-68页 |
第6章 全文总结 | 第68-70页 |
·研究工作和成果 | 第68-69页 |
·未来工作的展望 | 第69-70页 |
参考文献 | 第70-72页 |
在读期间发表的学术论文与取得的研究成果 | 第72-73页 |
在读期间参与的科研项目 | 第73-74页 |
致谢 | 第74页 |