首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向CPU-GPU异构并行系统的编程模型与编译优化关键技术研究

摘要第1-13页
ABSTRACT第13-17页
第一章 绪论第17-39页
   ·研究背景第18-22页
     ·GPU 与异构系统第18-20页
     ·面临的技术挑战第20-22页
   ·相关工作第22-33页
     ·异构系统编程模型第23-29页
     ·性能优化相关研究第29-33页
   ·研究内容第33-37页
     ·OpenStream 编程模型第34页
     ·存储感知的可扩展性分析第34-35页
     ·GPU 程序局部性分析与优化第35-36页
     ·基于栈距离图的GPU 程序cache 失效分析第36页
     ·OpenStream 编译框架及基本实现第36-37页
   ·主要创新第37-38页
   ·论文组织第38-39页
第二章 OpenStream 异构系统并行编程模型第39-67页
   ·异构系统编程问题的提出第39-43页
     ·OpenMP 编程模型第40-41页
     ·流编程模型第41-42页
     ·问题描述与求解思路第42-43页
   ·异构结点编程模型的要素第43-44页
   ·OpenMP 模型描述能力分析第44-56页
     ·并行机制映射第45-52页
     ·映射效率分析第52-53页
     ·BenchMarks 案例分析第53-56页
   ·OpenStream 编程模型的设计第56-64页
     ·语言机制的扩充第56-61页
     ·编程案例第61-64页
   ·本章小结第64-67页
第三章 存储层次感知的GPU 可扩展加速比模型第67-91页
   ·GPU 片上存储层次与可扩展加速比第67-71页
     ·GPU 片上存储层次第67-69页
     ·可扩展加速比模型第69-71页
   ·存储层次感知的加速比模型第71-82页
     ·体系结构模型第71-73页
     ·存储层次感知的加速比第73-77页
     ·可扩展性分析第77-81页
     ·设计与优化原则第81-82页
   ·实验验证第82-90页
     ·实验平台与测试用例第82-84页
     ·加速比第84-86页
     ·容量和带宽的影响第86-90页
   ·本章小结第90-91页
第四章 GPU 程序局部性分析与优化第91-113页
   ·问题的提出和思路第92-98页
     ·kernel 执行模型第92-93页
     ·基本概念第93-96页
     ·局部性分析方法第96-98页
   ·基于迭代序的局部性分析第98-103页
     ·重用距离第98-101页
     ·重用的可局部化条件第101页
     ·局部性求解第101-103页
   ·GPU 程序局部性优化第103-107页
     ·重用的迁移第103-106页
     ·优化局部性收益第106-107页
   ·实验验证第107-111页
     ·实验平台与测试用例第107-108页
     ·实验结果第108-111页
   ·本章小结第111-113页
第五章 基于栈距离图的GPU 程序cache 失效分析第113-135页
   ·问题的提出与分解第113-118页
     ·分析难点第113-114页
     ·问题分解第114-118页
   ·cache 失效分析模型第118-128页
     ·线程块栈距离图分析第118-127页
     ·线程块间cache 冲突访问分析第127-128页
   ·实验验证第128-132页
     ·测试用例及平台第128-129页
     ·单线程块栈距离图第129-131页
     ·cache 失效率第131-132页
   ·本章小结第132-135页
第六章 OpenStream 编译框架及实现第135-151页
   ·编译框架及基本实现第135-140页
     ·编译框架第135-136页
     ·基本实现第136-140页
   ·编译器优化第140-147页
     ·stream 级优化第140-147页
     ·kernel 级其他优化第147页
   ·实验验证第147-150页
   ·本章小结第150-151页
第七章 结论与展望第151-153页
   ·论文工作总结第151-152页
   ·课题研究展望第152-153页
致谢第153-155页
参考文献第155-171页
作者在学期间取得的学术成果第171-172页

论文共172页,点击 下载论文
上一篇:基于强度与刚度衰变的沥青混合料非线性疲劳损伤特性研究
下一篇:面向GPU的低功耗软件优化关键技术研究