首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于CPU-GPU异构平台的性能优化及多核并行编程模型的研究

摘要第1-5页
ABSTRACT第5-11页
第1章 绪论第11-20页
   ·研究背景及意义第11-14页
   ·研究现状第14-17页
     ·CPU-GPU 异构计算的研究现状第14-16页
     ·多核并行编程模型的研究现状第16-17页
   ·本文的研究内容第17-18页
     ·CPU-GPU 异构平台的性能优化第17-18页
     ·生物信息学中的问题求解第18页
     ·平台无关的多核并行编程模型第18页
   ·论文结构第18-20页
第2章 CUDA 计算平台第20-35页
   ·CUDA 简介第20-23页
     ·CUDA 理论基础第20-21页
     ·CUDA 的应用领域及成功案例第21-22页
     ·OpenCL第22-23页
   ·硬件体系结构第23-26页
     ·硬件设计第23-25页
     ·计算能力第25-26页
   ·软件模型第26-30页
     ·线程组织结构第26-28页
     ·存储器层次结构第28-29页
     ·编程模型第29-30页
   ·编程规范第30-34页
     ·C 语言扩展第30-31页
     ·函数与变量类型限定符第31-32页
     ·内置类型及内建变量第32-33页
     ·内核函数和执行配置第33-34页
     ·运行时API 和驱动API第34页
   ·本章小结第34-35页
第3章 CPU-GPU 异构计算平台的性能优化第35-51页
   ·影响程序性能的关键因素第35-36页
     ·访存延迟第35-36页
     ·负载分配第36页
     ·全局同步开销第36页
   ·访存优化策略第36-43页
     ·优化存储器之间的数据传输第37-39页
     ·利用全局存储器的联合访问第39-41页
     ·使用高效的共享存储器第41-43页
   ·代码优化策略第43-44页
     ·指令性能和延迟第43-44页
     ·避免控制流分支第44页
   ·高级优化策略第44-46页
     ·计算与通信重叠第44-45页
     ·主机和设备并行计算第45页
     ·用原子函数实现全局同步第45-46页
   ·实例验证第46-50页
     ·异构平台上的并行归并排序算法第46-47页
     ·实验结果及理论分析第47-50页
   ·本章小结第50-51页
第4章 CPU-GPU 异构计算平台在生物信息学中的应用第51-63页
   ·引言第51页
   ·问题描述第51-53页
     ·序列比对问题第51-52页
     ·Smith-Waterman 算法第52-53页
   ·Smith-Waterman 算法在异构系统上的实现第53-58页
     ·基于反对角线的并行实现第53-54页
     ·基于列的并行实现第54-58页
   ·优化方法及实验结果第58-62页
     ·循环使用共享存储器第58-59页
     ·采用类似于规约的方法计算最大值第59页
     ·实现了对全局存储器的联合访问第59-60页
     ·实验结果第60-62页
   ·本章小结第62-63页
第5章 平台无关的多核并行编程模型第63-71页
   ·引言第63-64页
   ·OpenMM 简介第64-66页
     ·OpenMM 概述第64-65页
     ·OpenMM 设计原则第65页
     ·OpenMM 的体系结构第65-66页
   ·多核并行编程模型的研究意义第66-67页
   ·平台无关的多核并行编程模型第67-68页
   ·原型系统及实验验证第68-69页
     ·面向科学计算的原型系统第68-69页
     ·实验结果第69页
   ·本章小结第69-71页
第6章 总结第71-74页
   ·本文工作第71-72页
   ·本文成果第72页
   ·进一步的工作第72-74页
参考文献第74-78页
附录1 插图索引第78-79页
附录2 表格索引第79-80页
致谢第80-82页
在读期间发表的学术论文第82-83页
在读期间参与的科研项目第83页

论文共83页,点击 下载论文
上一篇:基于多特征动态融合的图像分割研究
下一篇:油藏数值模拟中高效等值线生成算法研究