摘要 | 第1-14页 |
ABSTRACT | 第14-16页 |
第一章 绪论 | 第16-28页 |
·从单一高性能走向综合高效能 | 第16-19页 |
·高效能程序设计环境 | 第19-22页 |
·并行程序设计环境 | 第19-21页 |
·OpenMP | 第21-22页 |
·大规模系统上高效能OpenMP面临的挑战 | 第22-24页 |
·面向大规模并行系统的OpenMP实现 | 第22-23页 |
·性能可扩展性 | 第23页 |
·容错 | 第23-24页 |
·OpenMP低功耗 | 第24页 |
·论文的主要工作与创新 | 第24-26页 |
·主要研究内容 | 第24-25页 |
·主要创新点 | 第25-26页 |
·论文结构 | 第26-28页 |
第二章 面向大规模并行系统的CCRG OpenMP并行编译器设计和性能评估 | 第28-52页 |
·体系结构 | 第28-30页 |
·相关工作 | 第30-31页 |
·OpenMP并行编译器关键技术 | 第31-42页 |
·OpenMP线程管理与并行区实现 | 第31-33页 |
·任务的划分和调度 | 第33-38页 |
·数据属性的实现 | 第38-39页 |
·同步 | 第39-42页 |
·OpenMP编译器的实现 | 第42-45页 |
·性能测试与分析 | 第45-52页 |
·MicroBenchmark | 第45-47页 |
·NPB3.2-OMP | 第47-50页 |
·与SGI Altix的性能比较 | 第50-52页 |
第三章 OpenMP可扩展性研究 | 第52-82页 |
·扩展OpenMP指导命令 | 第52-60页 |
·问题描述和相关工作 | 第53页 |
·OpenMP扩展 | 第53-57页 |
·扩展指导命令的实现 | 第57-58页 |
·性能测试 | 第58-60页 |
·面向DSM的数据预取 | 第60-75页 |
·多处理机系统的数据预取 | 第61-62页 |
·OpenMP对数据预取的支持 | 第62-64页 |
·Cache预取与内存预取 | 第64-65页 |
·编译指导的两阶段预取策略 | 第65-75页 |
·基于内存预取的性能分析模型和测试 | 第75-81页 |
·模型建立 | 第75-76页 |
·基于模型的静态分析结果 | 第76-79页 |
·测试结果和分析 | 第79-81页 |
·小结 | 第81-82页 |
第四章 OpenMP混合式检查点/续算执行机制 | 第82-102页 |
·问题描述和相关工作 | 第82-85页 |
·检查点方法 | 第83页 |
·面向OpenMP的检查点/续算执行 | 第83-85页 |
·CCRG OpenMP混合检查点机制 | 第85-89页 |
·应用级OpenMP检查点 | 第85-86页 |
·混合OpenMP检查点/续算执行 | 第86-89页 |
·可移植的应用级C/R协议 | 第89-94页 |
·主动的和被动的检查点 | 第89-90页 |
·阻塞的检查点协议 | 第90-94页 |
·实验 | 第94-99页 |
·检查点的时间和空间开销 | 第94-98页 |
·续算执行的开销 | 第98-99页 |
·CCRG OpenMP与C~3系统的比较 | 第99-100页 |
·小结 | 第100-102页 |
第五章 针对OpenMP的功耗优化技术 | 第102-124页 |
·相关工作 | 第102-103页 |
·典型技术概述 | 第103-106页 |
·动态电压调整技术基础 | 第103-105页 |
·时间估计技术 | 第105-106页 |
·基于OpenMP编程模型的功耗优化技术 | 第106-118页 |
·利用OpenMP的fork/join执行模式的DVS | 第107-108页 |
·扩展障碍同步的DVS | 第108-110页 |
·基于最差执行时间的DVS | 第110-115页 |
·基于Profile的最差执行时间分析 | 第115-118页 |
·基于OpenMP的功耗优化实现 | 第118-120页 |
·模拟 | 第120-123页 |
·小结 | 第123-124页 |
第六章 结束语 | 第124-127页 |
·本文的主要贡献和创新点 | 第124-125页 |
·进一步的工作 | 第125-127页 |
致谢 | 第127-128页 |
参考文献 | 第128-144页 |
作者在学期间取得的学术成果 | 第144-145页 |
发表的论文 | 第144-145页 |
获得的科技奖励 | 第145页 |
读博士学位期间参加的科研工作 | 第145页 |