可重构众核流处理器上的编译与程序优化技术

摘要	第1-7页
ABSTRACT	第7-15页
第1章绪论	第15-28页
·研究背景	第15-21页
·流处理器体系结构的诞生与发展	第15-17页
·流编程模型的发展	第17-18页
·为什么需要可重构流处理器	第18-21页
·可重构众核流处理器编程和编译面临的几个关键问题	第21-25页
·指令集系统	第22-23页
·软件编译系统设计	第23-24页
·流程序中并行性的表示和开发	第24-25页
·论文的研究目标和主要工作	第25-26页
·论文结构	第26-28页
第2章流处理器编程与编译相关研究工作	第28-53页
·流处理器的指令集系统	第28-34页
·超长指令字VLIW	第28-31页
·并发线程执行指令集PTX	第31-32页
·DISC-D	第32-34页
·流处理器编程语言与编译器	第34-46页
·StreamC/KernelC	第34-38页
·StreamIt	第38-40页
·CUDA	第40-44页
·其它流编程语言	第44-46页
·CUDA编程模型的几种编译方案	第46-51页
·MCUDA	第46-47页
·OpenMP to GPGPU	第47-49页
·hiCUDA	第49-51页
·小结	第51-53页
第3章流编程模型与可重构众核流处理器上的执行模型研究	第53-67页
·流编程模型的研究	第53-54页
·可重构众核流处理器上的执行模型	第54-62页
·可重构众核流处理器体系结构简介	第55-57页
·超块执行模型的组织与执行	第57-62页
·流编程模型在可重构众核流处理器上的映射方案探索	第62-66页
·多线程映射方案	第62-64页
·核心程序的单一线程与组合线程两种映射方式	第64-66页
·小结	第66-67页
第4章扩展EDGE指令集系统的研究	第67-81页
·类数据流EDGE指令集系统	第67-72页
·指令格式	第67-70页
·EDGE指令集对可重构的支持	第70-72页
·设计面向可重构系统的扩展EDGE指令集DISC-S	第72-79页
·本章小结	第79-81页
第5章编译工具链设计-与实现	第81-120页
·编译系统设计框架	第81-85页
·Ptx2EDGE编译器	第85-107页
·编译链概述	第85-87页
·基于Antlr的前端实现	第87-93页
·语法树与控制流图中间表示形式的实现	第93-101页
·后端实现	第101-107页
·CUDA主机代码的编译实现	第107-113页
·主机代码中的CUDA C语言扩展	第108-109页
·CUDA运行时库移植	第109-113页
·实验评测	第113-118页
·正确性与超块产生效率	第114-116页
·性能评测	第116-118页
·本章小结	第118-120页
第6章流处理器上不规则程序优化技术研究	第120-134页
·不规则程序在流处理器上的性能分析	第120-124页
·不规则程序的行为特征与性能瓶颈	第120-122页
·不规则程序中的并行性分析	第122-124页
·实例研究：图广度优先遍历算法	第124-133页
·BFS算法的并行性分析	第124-125页
·基于可用并行性反馈的实现：FlexBFS	第125-127页
·动态队列的层次化优化	第127-129页
·不规则输入图中的负载平衡优化	第129-130页
·性能评测	第130-133页
·小结	第133-134页
第7章全文总结	第134-138页
·论文工作总结	第134-136页
·本文的主要创新点	第136-137页
·未来研究工作	第137-138页
参考文献	第138-143页
致谢	第143-144页
在读期间发表的学术论文与取得的研究成果	第144-146页
在读期间参与的科研项目	第146页