摘要 | 第1-13页 |
Abstract | 第13-15页 |
第一章 绪论 | 第15-35页 |
·研究背景 | 第16-23页 |
·异构系统与异构系统中的计算设备 | 第16-20页 |
·异构系统面临的可编程性问题 | 第20-23页 |
·相关工作 | 第23-30页 |
·面向异构系统的编程技术 | 第23-27页 |
·面向异构系统的性能优化 | 第27-29页 |
·基于异构系统的应用实例 | 第29-30页 |
·研究内容 | 第30-32页 |
·面向异构系统的协作编程框架 | 第30页 |
·层次化的负载均衡方法 | 第30-31页 |
·存储层次感知的访存优化 | 第31页 |
·基于协作编程框架的应用实现 | 第31-32页 |
·主要贡献 | 第32-33页 |
·文章结构 | 第33-35页 |
第二章 面向异构系统的协作编程框架研究 | 第35-53页 |
·面向异构系统的协作编程模型 | 第35-41页 |
·异构系统可编程性问题与协作编程模型 | 第35-37页 |
·异构系统开发模型抽象 | 第37-39页 |
·协作编程框架的设计 | 第39-41页 |
·协作编程框架应用层实现 | 第41-46页 |
·数据类型封装 | 第41-42页 |
·并行操作抽象 | 第42-45页 |
·编程接口以及典型任务流程 | 第45-46页 |
·协作编程框架系统结构层实现 | 第46-51页 |
·并行操作实现 | 第46-51页 |
·并行操作管理 | 第51页 |
·小结 | 第51-53页 |
第三章 层次化的负载均衡方法研究 | 第53-71页 |
·问题的提出与分解 | 第53-55页 |
·难点分析 | 第53-54页 |
·问题层次化分解 | 第54-55页 |
·节点间负载均衡 | 第55-60页 |
·静态任务分配方法 | 第55-58页 |
·动态负载均衡方法 | 第58-60页 |
·节点内负载均衡 | 第60-63页 |
·节点内任务级并行 | 第60-63页 |
·基于实测性能的动态任务分配 | 第63页 |
·计算设备内负载均衡 | 第63-65页 |
·多核CPU与Intel Xeon Phi内的负载均衡 | 第64页 |
·GPU内的负载均衡 | 第64-65页 |
·实验评测 | 第65-70页 |
·实验平台与测试用例 | 第65页 |
·性能评测 | 第65-70页 |
·小结 | 第70-71页 |
第四章 存储层次感知的访存优化研究 | 第71-89页 |
·异构系统存储结构分析 | 第71-75页 |
·多核CPU的存储结构 | 第72页 |
·GPU的存储结构 | 第72-73页 |
·Intel Xeon Phi的存储结构 | 第73-75页 |
·面向cache的优化方法 | 第75-80页 |
·数据存储局部性优化 | 第75-76页 |
·基于SIMD扩展指令的优化 | 第76-80页 |
·面向共享内存单元的优化方法 | 第80-84页 |
·实验评测 | 第84-87页 |
·测试用例与平台 | 第84页 |
·性能评测 | 第84-87页 |
·小结 | 第87-89页 |
第五章 基于协作编程框架的应用实例研究 | 第89-116页 |
·应用问题介绍 | 第89-94页 |
·MD模拟流程分析 | 第89-93页 |
·SWP应用问题简介 | 第93-94页 |
·基于协作编程框架的SWP模拟实现 | 第94-105页 |
·基于应用层的实现 | 第94-97页 |
·基于系统结构层的实现 | 第97-103页 |
·基于支撑层的优化 | 第103-105页 |
·基于混合编程方式的SWP模拟实现 | 第105-107页 |
·并行分解 | 第105页 |
·层次化并行 | 第105-106页 |
·计算内核设计 | 第106-107页 |
·实验评测 | 第107-115页 |
·实验平台 | 第107页 |
·可编程性评测 | 第107-109页 |
·性能评测 | 第109-115页 |
·小结 | 第115-116页 |
第六章 结论与展望 | 第116-118页 |
·工作总结 | 第116-117页 |
·研究展望 | 第117-118页 |
致谢 | 第118-119页 |
参考文献 | 第119-131页 |
作者在学期间取得的学术成果 | 第131页 |