首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

可重构众核流处理器上的编译与程序优化技术

摘要第1-7页
ABSTRACT第7-15页
第1章 绪论第15-28页
   ·研究背景第15-21页
     ·流处理器体系结构的诞生与发展第15-17页
     ·流编程模型的发展第17-18页
     ·为什么需要可重构流处理器第18-21页
   ·可重构众核流处理器编程和编译面临的几个关键问题第21-25页
     ·指令集系统第22-23页
     ·软件编译系统设计第23-24页
     ·流程序中并行性的表示和开发第24-25页
   ·论文的研究目标和主要工作第25-26页
   ·论文结构第26-28页
第2章 流处理器编程与编译相关研究工作第28-53页
   ·流处理器的指令集系统第28-34页
     ·超长指令字VLIW第28-31页
     ·并发线程执行指令集PTX第31-32页
     ·DISC-D第32-34页
   ·流处理器编程语言与编译器第34-46页
     ·StreamC/KernelC第34-38页
     ·StreamIt第38-40页
     ·CUDA第40-44页
     ·其它流编程语言第44-46页
   ·CUDA编程模型的几种编译方案第46-51页
     ·MCUDA第46-47页
     ·OpenMP to GPGPU第47-49页
     ·hiCUDA第49-51页
   ·小结第51-53页
第3章 流编程模型与可重构众核流处理器上的执行模型研究第53-67页
   ·流编程模型的研究第53-54页
   ·可重构众核流处理器上的执行模型第54-62页
     ·可重构众核流处理器体系结构简介第55-57页
     ·超块执行模型的组织与执行第57-62页
   ·流编程模型在可重构众核流处理器上的映射方案探索第62-66页
     ·多线程映射方案第62-64页
     ·核心程序的单一线程与组合线程两种映射方式第64-66页
   ·小结第66-67页
第4章 扩展EDGE指令集系统的研究第67-81页
   ·类数据流EDGE指令集系统第67-72页
     ·指令格式第67-70页
     ·EDGE指令集对可重构的支持第70-72页
   ·设计面向可重构系统的扩展EDGE指令集DISC-S第72-79页
   ·本章小结第79-81页
第5章 编译工具链设计-与实现第81-120页
   ·编译系统设计框架第81-85页
   ·Ptx2EDGE编译器第85-107页
     ·编译链概述第85-87页
     ·基于Antlr的前端实现第87-93页
     ·语法树与控制流图中间表示形式的实现第93-101页
     ·后端实现第101-107页
   ·CUDA主机代码的编译实现第107-113页
     ·主机代码中的CUDA C语言扩展第108-109页
     ·CUDA运行时库移植第109-113页
   ·实验评测第113-118页
     ·正确性与超块产生效率第114-116页
     ·性能评测第116-118页
   ·本章小结第118-120页
第6章 流处理器上不规则程序优化技术研究第120-134页
   ·不规则程序在流处理器上的性能分析第120-124页
     ·不规则程序的行为特征与性能瓶颈第120-122页
     ·不规则程序中的并行性分析第122-124页
   ·实例研究:图广度优先遍历算法第124-133页
     ·BFS算法的并行性分析第124-125页
     ·基于可用并行性反馈的实现:FlexBFS第125-127页
     ·动态队列的层次化优化第127-129页
     ·不规则输入图中的负载平衡优化第129-130页
     ·性能评测第130-133页
   ·小结第133-134页
第7章 全文总结第134-138页
   ·论文工作总结第134-136页
   ·本文的主要创新点第136-137页
   ·未来研究工作第137-138页
参考文献第138-143页
致谢第143-144页
在读期间发表的学术论文与取得的研究成果第144-146页
在读期间参与的科研项目第146页

论文共146页,点击 下载论文
上一篇:过渡金属氧属纳米半导体材料的液相合成、性能和潜在应用的研究
下一篇:广义几何,霍奇理论及其物理应用