摘要 | 第1-13页 |
Abstract | 第13-15页 |
第一章 绪论 | 第15-33页 |
·研究背景 | 第15-21页 |
·多核处理器的发展 | 第15-18页 |
·多核处理器编程面临的挑战 | 第18-20页 |
·异构多核处理器编译技术面临的挑战 | 第20-21页 |
·课题来源 | 第21页 |
·相关工作 | 第21-29页 |
·基于OpenMP 编程模型的多核编译技术 | 第21-23页 |
·基于流编程模型的多核编译技术 | 第23-24页 |
·其他多核编程模型 | 第24-27页 |
·SIMD 并行编译技术的相关工作 | 第27-29页 |
·本文的主要工作与技术创新 | 第29-31页 |
·本文主要工作 | 第29-30页 |
·本文技术创新 | 第30-31页 |
·本文的结构安排 | 第31-33页 |
第二章 面向异构多核处理器的代码自动生成框架 | 第33-67页 |
·问题提出 | 第33-35页 |
·编译框架 | 第35-37页 |
·数据对齐 | 第37-43页 |
·仿射图 | 第37-39页 |
·支配数组 | 第39页 |
·仿射图划分 | 第39-43页 |
·数据分布 | 第43-47页 |
·数据分布机制 | 第43-45页 |
·基于数据对齐的数据分布方法 | 第45-47页 |
·数据重分布 | 第47页 |
·通讯生成 | 第47-59页 |
·通讯 | 第48-53页 |
·通讯生成算法 | 第53-59页 |
·并行代码生成 | 第59页 |
·实验 | 第59-65页 |
·性能评测 | 第60-64页 |
·性能比较 | 第64-65页 |
·本章小结 | 第65-67页 |
第三章 面向异构多核处理器的数据自动管理 | 第67-87页 |
·研究背景 | 第67-69页 |
·数据自动管理框架 | 第69-78页 |
·分级数据分布 | 第70-72页 |
·通讯生成 | 第72-76页 |
·循环分块 | 第76-77页 |
·循环分裂 | 第77页 |
·代码生成实例 | 第77-78页 |
·优化 | 第78-82页 |
·数据重用合法性判定 | 第78-80页 |
·重用图 | 第80页 |
·基于图划分的通讯消除 | 第80-82页 |
·实验 | 第82-85页 |
·本章小结 | 第85-87页 |
第四章 面向异构多核处理器的模型驱动的多级并行开发 | 第87-117页 |
·研究背景 | 第87-90页 |
·BSP 模型 | 第87-89页 |
·基于BSP 模型的多任务多级并行 | 第89-90页 |
·资源分配模型 | 第90-97页 |
·模型定义 | 第90-95页 |
·同步 | 第95-97页 |
·模型构建方法 | 第97-106页 |
·变元选择 | 第97-99页 |
·任务分组 | 第99-101页 |
·PE 分配 | 第101-104页 |
·搜索空间构建 | 第104-106页 |
·基于模型的并行策略选择 | 第106-112页 |
·枚举搜索 | 第106-107页 |
·基于基因算法的智能搜索 | 第107-112页 |
·实验 | 第112-116页 |
·实验1:eflux | 第112-113页 |
·实验2:sobel | 第113-116页 |
·本章小结 | 第116-117页 |
第五章 SIMD 级并行开发 | 第117-139页 |
·代码生成框架 | 第118页 |
·预处理 | 第118-122页 |
·归纳变量识别 | 第118-120页 |
·强度削弱 | 第120-122页 |
·连续访存识别 | 第122页 |
·指令选择 | 第122-128页 |
·标识非自由指令 | 第122-123页 |
·代价子图生成 | 第123-128页 |
·SIMD 代码生成 | 第128-132页 |
·循环展开 | 第128-129页 |
·寄存器重命名 | 第129-130页 |
·归纳变量的复写传播与变量扩展 | 第130-131页 |
·指令合并 | 第131-132页 |
·并行代码生成 | 第132页 |
·实验 | 第132-137页 |
·实验环境 | 第132-134页 |
·实验结果 | 第134-137页 |
·本章小结 | 第137-139页 |
第六章 结论与展望 | 第139-143页 |
·工作总结 | 第139-140页 |
·研究展望 | 第140-143页 |
致谢 | 第143-145页 |
参考文献 | 第145-157页 |
作者在学期间取得的学术成果 | 第157-158页 |