首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

众核GPU体系结构相关技术研究

目录第1-7页
摘要第7-9页
Abstract第9-12页
第1章 绪论第12-33页
   ·研究背景第12-15页
     ·数据并行应用的需求第12-14页
     ·CPU体系结构面临的问题第14-15页
     ·VLSI技术的特点第15页
   ·GPU体系结构的并行机制第15-20页
     ·并行计算模型第15-17页
     ·GPU体系结构的特性第17-18页
     ·GPU与多核体系结构的区别第18-19页
     ·GPU与向量体系结构的区别第19-20页
   ·相关研究第20-29页
     ·GPU体系结构的演变第20-23页
     ·GPU编程模型的发展第23-25页
     ·GPGPU研究进展第25-29页
   ·论文工作第29-31页
     ·研究意义第29-30页
     ·研究目标第30-31页
     ·本文的创新点第31页
   ·论文结构第31-33页
第2章 GPU体系结构与编程模型第33-50页
   ·多核CPU-众核GPU异构系统的优势第33-35页
   ·主流GPGPU技术第35-43页
     ·AMD/ATISTREAM~TM技术第35-38页
     ·NVIDIA CUDA~TM技术第38-42页
     ·两种GPGPU技术对比第42-43页
   ·OPENCL:跨平台的多核与众核编程模型第43-46页
     ·平台模型第44页
     ·执行模型第44-45页
     ·存储模型第45页
     ·编程模型第45-46页
   ·数据并行体系结构第46-49页
   ·本章小结第49-50页
第3章 GPGPU量化性能模型第50-75页
   ·引言第50-51页
   ·相关工作第51-53页
   ·抽象的GPU体系结构与执行模型第53-55页
     ·GPU体系结构第53-54页
     ·GPU执行模型第54-55页
   ·量化的GPU性能评估模型第55-68页
     ·GPGPU程序性能因素第55-56页
     ·计算指令开销第56-58页
     ·全局存储器访问开销第58-60页
     ·局部存储器访问开销第60-62页
     ·条件分支转移开销第62-64页
     ·计算与访存重叠的影响第64-66页
     ·同步开销第66-67页
     ·总体性能模型第67-68页
   ·实验及结果分析第68-74页
     ·矩阵乘法第69-71页
     ·并行前缀和第71-73页
     ·误差分析与讨论第73-74页
   ·本章小结第74-75页
第4章 基于多面体模型的GPU存储优化第75-97页
   ·引言第75-76页
   ·相关工作第76-77页
   ·GPU存储优化空间第77-91页
     ·程序的多面体表示第78-79页
     ·全局存储器访问模式检测第79-82页
     ·全局存储器访问向量化第82-85页
     ·数据空间变换第85-87页
     ·快速存储器的分配与优化第87-91页
   ·实验及结果分析第91-96页
     ·全局存储器优化第91-94页
     ·快速存储器分配与优化第94-96页
   ·本章小结第96-97页
第5章 面向GPU体系结构的程序重构第97-121页
   ·引言第97-98页
   ·相关工作第98页
   ·基于循环-数组矩阵的程序重构第98-115页
     ·动机第98-100页
     ·基本思想第100-102页
     ·程序重构的形式化方法第102-113页
     ·实验评测第113-115页
   ·条件分支重构第115-120页
     ·条件分支对性能的影响第115-117页
     ·分支重构第117-119页
     ·实验评测第119-120页
   ·本章小结第120-121页
第6章 GPU加速的大规模生物序列比对第121-137页
   ·引言第121-122页
   ·相关工作第122-123页
   ·算法描述与改进第123-126页
     ·Smith-Waterman算法流程第123-124页
     ·SWAT并行方式第124-126页
   ·优化策略第126-130页
     ·基于参数分析的分段优化第126-127页
     ·基于缓冲区分块的读写延迟优化第127-129页
     ·基于循环展开的指令优化第129-130页
     ·数据传输优化第130页
     ·基于条件执行的条件分支优化第130页
   ·实验分析第130-136页
     ·与CPU版本的性能比较第131-134页
     ·不同GPU上的性能比较第134-135页
     ·横向性能比较第135-136页
   ·本章小结第136-137页
第7章 总结与展望第137-140页
   ·本文工作总结第137-138页
   ·进一步的工作第138-140页
参考文献第140-157页
致谢第157-158页
攻读博士期间发表(录用)论文情况第158-159页

论文共159页,点击 下载论文
上一篇:垂直搜索引擎若干问题研究
下一篇:基于本体的农业领域知识服务若干关键技术研究