面向多核处理器的并行编译及优化关键技术研究

摘要	第1-13页
Abstract	第13-15页
第一章绪论	第15-33页
·研究背景	第15-21页
·多核处理器的发展	第15-18页
·多核处理器编程面临的挑战	第18-20页
·异构多核处理器编译技术面临的挑战	第20-21页
·课题来源	第21页
·相关工作	第21-29页
·基于OpenMP 编程模型的多核编译技术	第21-23页
·基于流编程模型的多核编译技术	第23-24页
·其他多核编程模型	第24-27页
·SIMD 并行编译技术的相关工作	第27-29页
·本文的主要工作与技术创新	第29-31页
·本文主要工作	第29-30页
·本文技术创新	第30-31页
·本文的结构安排	第31-33页
第二章面向异构多核处理器的代码自动生成框架	第33-67页
·问题提出	第33-35页
·编译框架	第35-37页
·数据对齐	第37-43页
·仿射图	第37-39页
·支配数组	第39页
·仿射图划分	第39-43页
·数据分布	第43-47页
·数据分布机制	第43-45页
·基于数据对齐的数据分布方法	第45-47页
·数据重分布	第47页
·通讯生成	第47-59页
·通讯	第48-53页
·通讯生成算法	第53-59页
·并行代码生成	第59页
·实验	第59-65页
·性能评测	第60-64页
·性能比较	第64-65页
·本章小结	第65-67页
第三章面向异构多核处理器的数据自动管理	第67-87页
·研究背景	第67-69页
·数据自动管理框架	第69-78页
·分级数据分布	第70-72页
·通讯生成	第72-76页
·循环分块	第76-77页
·循环分裂	第77页
·代码生成实例	第77-78页
·优化	第78-82页
·数据重用合法性判定	第78-80页
·重用图	第80页
·基于图划分的通讯消除	第80-82页
·实验	第82-85页
·本章小结	第85-87页
第四章面向异构多核处理器的模型驱动的多级并行开发	第87-117页
·研究背景	第87-90页
·BSP 模型	第87-89页
·基于BSP 模型的多任务多级并行	第89-90页
·资源分配模型	第90-97页
·模型定义	第90-95页
·同步	第95-97页
·模型构建方法	第97-106页
·变元选择	第97-99页
·任务分组	第99-101页
·PE 分配	第101-104页
·搜索空间构建	第104-106页
·基于模型的并行策略选择	第106-112页
·枚举搜索	第106-107页
·基于基因算法的智能搜索	第107-112页
·实验	第112-116页
·实验1：eflux	第112-113页
·实验2：sobel	第113-116页
·本章小结	第116-117页
第五章 SIMD 级并行开发	第117-139页
·代码生成框架	第118页
·预处理	第118-122页
·归纳变量识别	第118-120页
·强度削弱	第120-122页
·连续访存识别	第122页
·指令选择	第122-128页
·标识非自由指令	第122-123页
·代价子图生成	第123-128页
·SIMD 代码生成	第128-132页
·循环展开	第128-129页
·寄存器重命名	第129-130页
·归纳变量的复写传播与变量扩展	第130-131页
·指令合并	第131-132页
·并行代码生成	第132页
·实验	第132-137页
·实验环境	第132-134页
·实验结果	第134-137页
·本章小结	第137-139页
第六章结论与展望	第139-143页
·工作总结	第139-140页
·研究展望	第140-143页
致谢	第143-145页
参考文献	第145-157页
作者在学期间取得的学术成果	第157-158页