摘要 | 第1-7页 |
ABSTRACT | 第7-14页 |
第1章 绪论 | 第14-24页 |
·课题研究背景 | 第14-17页 |
·异构系统介绍 | 第14-16页 |
·加速器计算面临的技术问题 | 第16-17页 |
·相关工作 | 第17-21页 |
·基于制导的编程语言扩展 | 第17-20页 |
·基于制导的源到源翻译 | 第20-21页 |
·本文的主要工作与目标 | 第21-22页 |
·论文组织结构 | 第22-24页 |
第2章 OpenACC语言特点和Xeon Phi结构特性分析 | 第24-40页 |
·OpenACC的语言特点 | 第24-30页 |
·OpenACC执行模型 | 第24-27页 |
·OpenACC存储模型 | 第27-28页 |
·OpenACC指令语法 | 第28-30页 |
·XeonPhi的结构特性 | 第30-38页 |
·Xeon Phi硬件架构 | 第31-32页 |
·Xeon Phi软件架构及编程方法 | 第32-34页 |
·Xeon Phi缓存层次结构 | 第34-36页 |
·Xeon Phi优化方法 | 第36-38页 |
·本章小结 | 第38-40页 |
第3章 OpenACC_JX源到源翻译器的设计与实现 | 第40-54页 |
·总体框架设计 | 第40-41页 |
·Clang编译器 | 第41-46页 |
·Clang的内部表示 | 第41-43页 |
·Clang的重要类 | 第43-45页 |
·LibTooling库 | 第45-46页 |
·分析过程 | 第46-50页 |
·驱动模块的扩展 | 第47-48页 |
·AST模块的扩展 | 第48-49页 |
·分析器模块的扩展 | 第49-50页 |
·转换过程 | 第50-52页 |
·任务管理部分的映射 | 第50-51页 |
·数据管理部分的映射 | 第51页 |
·并行性管理部分的映射 | 第51-52页 |
·小结 | 第52-54页 |
第4章 源到源翻译器的性能优化 | 第54-60页 |
·数据传输优化 | 第54-57页 |
·向量化优化 | 第57-58页 |
·小结 | 第58-60页 |
第5章 源到源翻译器的性能评测 | 第60-68页 |
·评测环境 | 第60-62页 |
·硬件平台 | 第60页 |
·测试程序 | 第60-62页 |
·实验结果 | 第62-66页 |
·正确性验证 | 第62-63页 |
·两种优化方法的性能评测 | 第63-64页 |
·总体性能评测 | 第64-65页 |
·不同平台上性能评测 | 第65-66页 |
·小结 | 第66-68页 |
第6章 总结与展望 | 第68-70页 |
·工作总结 | 第68-69页 |
·工作展望 | 第69-70页 |
参考文献 | 第70-74页 |
致谢 | 第74-76页 |
在读期间发表的学术论文与取得的研究成果 | 第76-78页 |
在读期间参与的科研项目 | 第78页 |