数据分布全局优化技术
第一章 绪论 | 第1-23页 |
·并行处理系统对软件的挑战 | 第9-11页 |
·现有的开发并行软件的主要途径 | 第11-14页 |
·显式并行的方法 | 第11-13页 |
·利用自动并行编译器 | 第13-14页 |
·并行编译中的全局优化 | 第14-20页 |
·全局的计算分割和数据分布策略优化 | 第15-16页 |
·通讯优化 | 第16-20页 |
·负载平衡 | 第20页 |
·论文的组织 | 第20-23页 |
第二章 并行计算分割和数据分布优化技术 | 第23-41页 |
·并行计算分割和数据分布优化的原则 | 第23-27页 |
·“拥有者计算”的原则 | 第23-25页 |
·选择并行分割循环的粒度 | 第25-26页 |
·数据存贮问题 | 第26-27页 |
·循环变换技术对并行优化的意义 | 第27-31页 |
·利用循环变换优化数据的局部性 | 第28-30页 |
·选择恰当的并行粒度 | 第30-31页 |
·数据分布技术 | 第31-39页 |
·显式数据分布 | 第32-34页 |
·自动数据分布技术 | 第34-37页 |
·数据重分布的问题 | 第37-39页 |
·软流水 | 第39-41页 |
第三章 语言扩展 | 第41-58页 |
·语言扩展的意义 | 第41-42页 |
·语言扩展的原则 | 第42-43页 |
·语言扩展的背景 | 第43页 |
·制导的定义 | 第43-58页 |
·关于数据分布的制导 | 第43-49页 |
·关于循环的制导 | 第49-55页 |
·指明分析优先顺序的制导 | 第55-58页 |
第四章 循环分割和数据分布的优化 | 第58-80页 |
·过程内分析的约定 | 第58-60页 |
·基本约定 | 第58-59页 |
·数据重分布的考虑 | 第59页 |
·关键程序段的定义 | 第59-60页 |
·确定对齐关系的原理 | 第60-64页 |
·数组与循环的对齐关系 | 第61-62页 |
·数组之间的对齐关系 | 第62-63页 |
·通讯量的估计 | 第63页 |
·偏移量的处理 | 第63-64页 |
·程序对齐信息图PAIG | 第64-65页 |
·由PAIG图求数组与循环的对齐关系 | 第65-67页 |
·由PAIG图求数组间的对齐关系 | 第67-69页 |
·根据程序对齐信息图决定数组分布和循环分割模式 | 第69-73页 |
·循环的优化 | 第73-78页 |
·循环流水执行的意义 | 第73-75页 |
·流水的合法性: | 第75-76页 |
·流水的可行性: | 第76-77页 |
·循环优化的算法 | 第77-78页 |
·过程内分析的总体算法 | 第78-79页 |
·一个例子 | 第79-80页 |
第五章 数据分布的过程间优化技术 | 第80-103页 |
·过程间分析对全局并行优化的意义 | 第80-82页 |
·现有处理过程调用的方法 | 第82-86页 |
·数据分布映射的变换 | 第86-92页 |
·概念与术语 | 第87-88页 |
·公共量分布技术 | 第88-90页 |
·分布模式变换 | 第90-92页 |
·数组分布模式一致性的判定 | 第92页 |
·优化过程调用的算法 | 第92-100页 |
·算法结构 | 第93-99页 |
·应用举例 | 第99-100页 |
·关于过程间优化算法的进一步考虑 | 第100-103页 |
第六章 系统的实现与实验结果 | 第103-119页 |
·系统实现的软、硬件环境 | 第103-105页 |
·autopar并行编译系统的结构 | 第105-111页 |
·autopar静态编译的流程 | 第106-108页 |
·autopar生成的并行程序的运行 | 第108-109页 |
·动态行为监测工具ParaVT | 第109-111页 |
·autopar在曙光2000上的测试及结果 | 第111-119页 |
·测试用例介绍 | 第111-112页 |
·测试结果 | 第112-113页 |
·测试结果分析 | 第113-119页 |
第七章 总结与展望 | 第119-124页 |
·结论 | 第119-120页 |
·自己的工作 | 第120-121页 |
·进一步的工作 | 第121-124页 |
·autopar系统的进一步改进 | 第121-122页 |
·人机交互的集成化并行编程环境的研制 | 第122-124页 |
参考文献 | 第124-131页 |
作者简介 | 第131页 |