首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

合并与分割--访存数据流优化方法研究

摘要第1-11页
ABSTRACT第11-13页
第一章 绪论第13-31页
   ·研究背景第13-20页
     ·并行处理层次及其瓶颈问题第13-17页
     ·面向并行处理的编程模型和编程语言第17-20页
   ·基本术语第20-21页
   ·相关研究及存在的问题第21-28页
     ·面向结点内层次存储的相关研究第21-26页
     ·面向分布存储的相关研究第26-28页
   ·本文的主要工作及创新第28-30页
   ·文章的组织结构第30-31页
第二章 共享数组交叉合并优化方法第31-55页
   ·引言第31-32页
   ·分布共享存储体系结构对共享编程的支持第32-36页
     ·硬件支持全局编址DSM系统第33-35页
     ·软件支持全局编址DSM系统第35-36页
   ·基于SDSM的OpenMP编译器第36-38页
     ·OpenMP编程规范第36-37页
     ·典型的OpenMP/SDSM编译器第37-38页
   ·共享数组交叉合并优化方法及其实现考虑第38-54页
     ·共享数组交叉合并优化思想的产生背景第38-42页
     ·共享数组交叉合并基本优化思想第42-45页
     ·实现共享数组交叉合并优化必须解决的问题第45-49页
     ·共享数组交叉合并优化方法的实现第49-51页
     ·性能测试及结果分析第51-54页
   ·小结第54-55页
第三章 基于数据访问轨迹对准的数组融合优化方法第55-73页
   ·引言第55-57页
   ·数组空间和数据访问轨迹第57-60页
   ·数组访问距离向量(ADV)及相关概念第60-61页
   ·基于ADV的数组融合方法第61-66页
   ·扩展的访问亲密关系及性能代价模型第66-69页
     ·基于profile信息的编译分析方法第66-68页
     ·性能代价判别规则第68-69页
     ·允许在各计算段改变数组布局第69页
   ·性能测试和比较第69-72页
   ·小结第72-73页
第四章 临时数据空间合并优化方法第73-89页
   ·临时数据空间合并优化的基本思想第73-74页
   ·循环排序优化的基本思想第74-76页
     ·数据重用理论第74-76页
     ·循环变换优化原理第76页
   ·Fortran语言中的并行语法成分第76-79页
     ·Fortran语言的发展第76-77页
     ·数组赋值语句与数组标量化第77-78页
     ·FORALL结构的特点第78-79页
   ·两种优化方法在FORALL实现过程中的综合运用第79-82页
     ·FORALL结构的实现第79-80页
     ·临时数据空间合并第80-81页
     ·嵌套循环排序第81-82页
   ·性能测试第82-88页
     ·编译器相关情况第82-84页
     ·性能分析工具PAPI简介第84-85页
     ·测试用例和测试平台第85-86页
     ·测试结果第86-88页
   ·小结第88-89页
第五章 流分割和线性kernel合并优化方法第89-111页
   ·流处理器的研究现状第89-92页
   ·Imagine流处理器的体系结构和编程模型第92-97页
     ·Imagine流处理器的体系结构第92-94页
     ·Imagine流处理器的编程模型第94-95页
     ·Imagine模拟器ISim第95-97页
   ·流分割和线性kernel合并优化第97-107页
     ·流分割优化第97-99页
     ·线性kernel合并优化第99-102页
     ·性能测试第102-107页
   ·流编译和流应用关键问题分析第107-110页
     ·优化机会第107-108页
     ·关键问题第108-110页
   ·小结第110-111页
第六章 结束语第111-114页
   ·工作总结第111-112页
   ·研究展望第112-114页
攻读博士学位期间发表的论文第114-115页
攻读博士学位期间参加的科研工作第115-116页
致谢第116-117页
参考文献第117-126页

论文共126页,点击 下载论文
上一篇:立体选择性合成α-细辛脑的工艺研究
下一篇:SiC_p/Al电子封装复合材料的SPS烧结及性能研究