合并与分割--访存数据流优化方法研究
摘要 | 第1-11页 |
ABSTRACT | 第11-13页 |
第一章 绪论 | 第13-31页 |
·研究背景 | 第13-20页 |
·并行处理层次及其瓶颈问题 | 第13-17页 |
·面向并行处理的编程模型和编程语言 | 第17-20页 |
·基本术语 | 第20-21页 |
·相关研究及存在的问题 | 第21-28页 |
·面向结点内层次存储的相关研究 | 第21-26页 |
·面向分布存储的相关研究 | 第26-28页 |
·本文的主要工作及创新 | 第28-30页 |
·文章的组织结构 | 第30-31页 |
第二章 共享数组交叉合并优化方法 | 第31-55页 |
·引言 | 第31-32页 |
·分布共享存储体系结构对共享编程的支持 | 第32-36页 |
·硬件支持全局编址DSM系统 | 第33-35页 |
·软件支持全局编址DSM系统 | 第35-36页 |
·基于SDSM的OpenMP编译器 | 第36-38页 |
·OpenMP编程规范 | 第36-37页 |
·典型的OpenMP/SDSM编译器 | 第37-38页 |
·共享数组交叉合并优化方法及其实现考虑 | 第38-54页 |
·共享数组交叉合并优化思想的产生背景 | 第38-42页 |
·共享数组交叉合并基本优化思想 | 第42-45页 |
·实现共享数组交叉合并优化必须解决的问题 | 第45-49页 |
·共享数组交叉合并优化方法的实现 | 第49-51页 |
·性能测试及结果分析 | 第51-54页 |
·小结 | 第54-55页 |
第三章 基于数据访问轨迹对准的数组融合优化方法 | 第55-73页 |
·引言 | 第55-57页 |
·数组空间和数据访问轨迹 | 第57-60页 |
·数组访问距离向量(ADV)及相关概念 | 第60-61页 |
·基于ADV的数组融合方法 | 第61-66页 |
·扩展的访问亲密关系及性能代价模型 | 第66-69页 |
·基于profile信息的编译分析方法 | 第66-68页 |
·性能代价判别规则 | 第68-69页 |
·允许在各计算段改变数组布局 | 第69页 |
·性能测试和比较 | 第69-72页 |
·小结 | 第72-73页 |
第四章 临时数据空间合并优化方法 | 第73-89页 |
·临时数据空间合并优化的基本思想 | 第73-74页 |
·循环排序优化的基本思想 | 第74-76页 |
·数据重用理论 | 第74-76页 |
·循环变换优化原理 | 第76页 |
·Fortran语言中的并行语法成分 | 第76-79页 |
·Fortran语言的发展 | 第76-77页 |
·数组赋值语句与数组标量化 | 第77-78页 |
·FORALL结构的特点 | 第78-79页 |
·两种优化方法在FORALL实现过程中的综合运用 | 第79-82页 |
·FORALL结构的实现 | 第79-80页 |
·临时数据空间合并 | 第80-81页 |
·嵌套循环排序 | 第81-82页 |
·性能测试 | 第82-88页 |
·编译器相关情况 | 第82-84页 |
·性能分析工具PAPI简介 | 第84-85页 |
·测试用例和测试平台 | 第85-86页 |
·测试结果 | 第86-88页 |
·小结 | 第88-89页 |
第五章 流分割和线性kernel合并优化方法 | 第89-111页 |
·流处理器的研究现状 | 第89-92页 |
·Imagine流处理器的体系结构和编程模型 | 第92-97页 |
·Imagine流处理器的体系结构 | 第92-94页 |
·Imagine流处理器的编程模型 | 第94-95页 |
·Imagine模拟器ISim | 第95-97页 |
·流分割和线性kernel合并优化 | 第97-107页 |
·流分割优化 | 第97-99页 |
·线性kernel合并优化 | 第99-102页 |
·性能测试 | 第102-107页 |
·流编译和流应用关键问题分析 | 第107-110页 |
·优化机会 | 第107-108页 |
·关键问题 | 第108-110页 |
·小结 | 第110-111页 |
第六章 结束语 | 第111-114页 |
·工作总结 | 第111-112页 |
·研究展望 | 第112-114页 |
攻读博士学位期间发表的论文 | 第114-115页 |
攻读博士学位期间参加的科研工作 | 第115-116页 |
致谢 | 第116-117页 |
参考文献 | 第117-126页 |