摘要 | 第1-7页 |
ABSTRACT | 第7-15页 |
第1章 绪论 | 第15-28页 |
·研究背景 | 第15-21页 |
·流处理器体系结构的诞生与发展 | 第15-17页 |
·流编程模型的发展 | 第17-18页 |
·为什么需要可重构流处理器 | 第18-21页 |
·可重构众核流处理器编程和编译面临的几个关键问题 | 第21-25页 |
·指令集系统 | 第22-23页 |
·软件编译系统设计 | 第23-24页 |
·流程序中并行性的表示和开发 | 第24-25页 |
·论文的研究目标和主要工作 | 第25-26页 |
·论文结构 | 第26-28页 |
第2章 流处理器编程与编译相关研究工作 | 第28-53页 |
·流处理器的指令集系统 | 第28-34页 |
·超长指令字VLIW | 第28-31页 |
·并发线程执行指令集PTX | 第31-32页 |
·DISC-D | 第32-34页 |
·流处理器编程语言与编译器 | 第34-46页 |
·StreamC/KernelC | 第34-38页 |
·StreamIt | 第38-40页 |
·CUDA | 第40-44页 |
·其它流编程语言 | 第44-46页 |
·CUDA编程模型的几种编译方案 | 第46-51页 |
·MCUDA | 第46-47页 |
·OpenMP to GPGPU | 第47-49页 |
·hiCUDA | 第49-51页 |
·小结 | 第51-53页 |
第3章 流编程模型与可重构众核流处理器上的执行模型研究 | 第53-67页 |
·流编程模型的研究 | 第53-54页 |
·可重构众核流处理器上的执行模型 | 第54-62页 |
·可重构众核流处理器体系结构简介 | 第55-57页 |
·超块执行模型的组织与执行 | 第57-62页 |
·流编程模型在可重构众核流处理器上的映射方案探索 | 第62-66页 |
·多线程映射方案 | 第62-64页 |
·核心程序的单一线程与组合线程两种映射方式 | 第64-66页 |
·小结 | 第66-67页 |
第4章 扩展EDGE指令集系统的研究 | 第67-81页 |
·类数据流EDGE指令集系统 | 第67-72页 |
·指令格式 | 第67-70页 |
·EDGE指令集对可重构的支持 | 第70-72页 |
·设计面向可重构系统的扩展EDGE指令集DISC-S | 第72-79页 |
·本章小结 | 第79-81页 |
第5章 编译工具链设计-与实现 | 第81-120页 |
·编译系统设计框架 | 第81-85页 |
·Ptx2EDGE编译器 | 第85-107页 |
·编译链概述 | 第85-87页 |
·基于Antlr的前端实现 | 第87-93页 |
·语法树与控制流图中间表示形式的实现 | 第93-101页 |
·后端实现 | 第101-107页 |
·CUDA主机代码的编译实现 | 第107-113页 |
·主机代码中的CUDA C语言扩展 | 第108-109页 |
·CUDA运行时库移植 | 第109-113页 |
·实验评测 | 第113-118页 |
·正确性与超块产生效率 | 第114-116页 |
·性能评测 | 第116-118页 |
·本章小结 | 第118-120页 |
第6章 流处理器上不规则程序优化技术研究 | 第120-134页 |
·不规则程序在流处理器上的性能分析 | 第120-124页 |
·不规则程序的行为特征与性能瓶颈 | 第120-122页 |
·不规则程序中的并行性分析 | 第122-124页 |
·实例研究:图广度优先遍历算法 | 第124-133页 |
·BFS算法的并行性分析 | 第124-125页 |
·基于可用并行性反馈的实现:FlexBFS | 第125-127页 |
·动态队列的层次化优化 | 第127-129页 |
·不规则输入图中的负载平衡优化 | 第129-130页 |
·性能评测 | 第130-133页 |
·小结 | 第133-134页 |
第7章 全文总结 | 第134-138页 |
·论文工作总结 | 第134-136页 |
·本文的主要创新点 | 第136-137页 |
·未来研究工作 | 第137-138页 |
参考文献 | 第138-143页 |
致谢 | 第143-144页 |
在读期间发表的学术论文与取得的研究成果 | 第144-146页 |
在读期间参与的科研项目 | 第146页 |