摘要 | 第1-7页 |
ABSTRACT | 第7-12页 |
图目录 | 第12-14页 |
表目录 | 第14-15页 |
第1章 绪论 | 第15-25页 |
·异构系统的出现和流行 | 第15-17页 |
·异构系统上的编程模型和编译面临的几个关键问题 | 第17-21页 |
·编程复杂 | 第17-19页 |
·优化困难 | 第19-20页 |
·可移植性差 | 第20-21页 |
·论文的研究目标和研究内容 | 第21-23页 |
·提出面向异构系统的易编程并可移植的编程模型 | 第21-22页 |
·编程模型实现中的性能优化技术 | 第22-23页 |
·实现过程中的其他相关技术 | 第23页 |
·论文组织结构 | 第23-25页 |
第2章 异构系统上并行编程模型的相关研究工作 | 第25-47页 |
·异构系统介绍 | 第25页 |
·编程模型 | 第25-38页 |
·传统语言基础上的扩展 | 第26-33页 |
·以库的形式提供常用算法的封装 | 第33-35页 |
·基于制导的编程语言扩展 | 第35-37页 |
·自动并行化 | 第37-38页 |
·主要研究方面 | 第38-42页 |
·易编程性和可移植性 | 第38-39页 |
·性能优化技术 | 第39-42页 |
·取得的结果 | 第42页 |
·各个方法的比较 | 第42-45页 |
·小结 | 第45-47页 |
第3章 基于制导语言的高层编程模型 | 第47-67页 |
·制导语言的功能分析 | 第47-54页 |
·异构系统上并行编程模型 | 第47-48页 |
·异构系统上的编程语言的必备功能 | 第48-50页 |
·异构系统上基于制导语言的必备功能 | 第50-52页 |
·异构系统上基于制导语言的对比分析 | 第52-54页 |
·一个制导语言实例:OpenHMPP | 第54-63页 |
·制导语言描述 | 第55-60页 |
·制导语言示例 | 第60-63页 |
·OpenHMPP+:对OpenHMPP制导语言的扩展设计 | 第63页 |
·制导语言的程序设计和编译流程 | 第63-65页 |
·小结 | 第65-67页 |
第4章 面向访存性能的程序分析和优化技术 | 第67-93页 |
·引言 | 第67页 |
·背景 | 第67-73页 |
·GPU结构模型 | 第67-71页 |
·GPU程序执行模型 | 第71-73页 |
·访存特征分析 | 第73-79页 |
·访存模式 | 第73-75页 |
·数据重用及重用距离 | 第75-79页 |
·访存优化技术 | 第79-87页 |
·合并存储访问 | 第80-83页 |
·加载重用数据到片上 | 第83-86页 |
·减少访存冲突 | 第86-87页 |
·其他优化技术 | 第87-91页 |
·启动配置选择技术 | 第87-90页 |
·循环展开 | 第90-91页 |
·小结 | 第91-93页 |
第5章 运行时支撑技术 | 第93-101页 |
·引言 | 第93页 |
·背景 | 第93-95页 |
·CPU-GPU异构系统的通常配置 | 第93-94页 |
·问题及解决方案 | 第94-95页 |
·CPU-GPU动态数据传输管理机制 | 第95-99页 |
·小结 | 第99-101页 |
第6章 编译框架的设计及实现 | 第101-135页 |
·引言 | 第101页 |
·编译框架的设计及基本实现 | 第101-108页 |
·编译框架的设计 | 第101-103页 |
·基本实现 | 第103-108页 |
·编译优化技术 | 第108-111页 |
·计算核心优化器 | 第108-109页 |
·多目标GPU生成技术 | 第109-111页 |
·实验平台及性能评价方法 | 第111页 |
·实验平台介绍 | 第111页 |
·测试程序及性能评价方法 | 第111页 |
·实验结果 | 第111-132页 |
·小结 | 第132-135页 |
第7章 总结及未来工作 | 第135-139页 |
·本文工作总结 | 第135-136页 |
·本文中主要的创新点 | 第136-137页 |
·未来研究工作 | 第137-139页 |
参考文献 | 第139-145页 |
致谢 | 第145-147页 |
在读期间发表的学术论文与取得的研究成果 | 第147-149页 |
在读期间参与的科研项目 | 第149页 |