首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

CPU-GPU异构系统上的高层编程模型及其编译优化技术

摘要第1-7页
ABSTRACT第7-12页
图目录第12-14页
表目录第14-15页
第1章 绪论第15-25页
   ·异构系统的出现和流行第15-17页
   ·异构系统上的编程模型和编译面临的几个关键问题第17-21页
     ·编程复杂第17-19页
     ·优化困难第19-20页
     ·可移植性差第20-21页
   ·论文的研究目标和研究内容第21-23页
     ·提出面向异构系统的易编程并可移植的编程模型第21-22页
     ·编程模型实现中的性能优化技术第22-23页
     ·实现过程中的其他相关技术第23页
   ·论文组织结构第23-25页
第2章 异构系统上并行编程模型的相关研究工作第25-47页
   ·异构系统介绍第25页
   ·编程模型第25-38页
     ·传统语言基础上的扩展第26-33页
     ·以库的形式提供常用算法的封装第33-35页
     ·基于制导的编程语言扩展第35-37页
     ·自动并行化第37-38页
   ·主要研究方面第38-42页
     ·易编程性和可移植性第38-39页
     ·性能优化技术第39-42页
   ·取得的结果第42页
   ·各个方法的比较第42-45页
   ·小结第45-47页
第3章 基于制导语言的高层编程模型第47-67页
   ·制导语言的功能分析第47-54页
     ·异构系统上并行编程模型第47-48页
     ·异构系统上的编程语言的必备功能第48-50页
     ·异构系统上基于制导语言的必备功能第50-52页
     ·异构系统上基于制导语言的对比分析第52-54页
   ·一个制导语言实例:OpenHMPP第54-63页
     ·制导语言描述第55-60页
     ·制导语言示例第60-63页
   ·OpenHMPP+:对OpenHMPP制导语言的扩展设计第63页
   ·制导语言的程序设计和编译流程第63-65页
   ·小结第65-67页
第4章 面向访存性能的程序分析和优化技术第67-93页
   ·引言第67页
   ·背景第67-73页
     ·GPU结构模型第67-71页
     ·GPU程序执行模型第71-73页
   ·访存特征分析第73-79页
     ·访存模式第73-75页
     ·数据重用及重用距离第75-79页
   ·访存优化技术第79-87页
     ·合并存储访问第80-83页
     ·加载重用数据到片上第83-86页
     ·减少访存冲突第86-87页
   ·其他优化技术第87-91页
     ·启动配置选择技术第87-90页
     ·循环展开第90-91页
   ·小结第91-93页
第5章 运行时支撑技术第93-101页
   ·引言第93页
   ·背景第93-95页
     ·CPU-GPU异构系统的通常配置第93-94页
     ·问题及解决方案第94-95页
   ·CPU-GPU动态数据传输管理机制第95-99页
   ·小结第99-101页
第6章 编译框架的设计及实现第101-135页
   ·引言第101页
   ·编译框架的设计及基本实现第101-108页
     ·编译框架的设计第101-103页
     ·基本实现第103-108页
   ·编译优化技术第108-111页
     ·计算核心优化器第108-109页
     ·多目标GPU生成技术第109-111页
   ·实验平台及性能评价方法第111页
     ·实验平台介绍第111页
     ·测试程序及性能评价方法第111页
   ·实验结果第111-132页
   ·小结第132-135页
第7章 总结及未来工作第135-139页
   ·本文工作总结第135-136页
   ·本文中主要的创新点第136-137页
   ·未来研究工作第137-139页
参考文献第139-145页
致谢第145-147页
在读期间发表的学术论文与取得的研究成果第147-149页
在读期间参与的科研项目第149页

论文共149页,点击 下载论文
上一篇:内核级二进制翻译系统设计及性能优化
下一篇:智能视频监控下的多目标跟踪技术研究