面向千万亿次CPU-GPU异构系统的编程模型与性能优化关键技术研究

摘要	第10-12页
ABSTRACT	第12-14页
第一章绪论	第15-39页
1.1 研究背景	第16-24页
1.1.1 GPU与异构系统	第17-20页
1.1.2 大规模CPU-GPU异构系统面临的技术挑战	第20-24页
1.2 相关工作	第24-34页
1.2.1 GPU编程、优化方法和性能模型	第24-30页
1.2.2 CPU-GPU异构系统编程和优化方法	第30-31页
1.2.3 典型千万亿次异构系统体系结构和并行软件支持	第31-34页
1.3 研究内容	第34-36页
1.4 主要创新	第36-37页
1.5 论文组织	第37-39页
第二章千万亿次CPU-GPU异构系统并行编程模型研究	第39-53页
2.1 千万亿次系统MPI/Open MP/Streaming混合编程模型	第39-40页
2.2 混合编程模型的任务映射	第40-46页
2.2.1 结点为中心的任务映射	第42页
2.2.2 CPU为中心的任务映射	第42-44页
2.2.3 GPU为中心的任务映射	第44-45页
2.2.4 任务映射方法总结	第45页
2.2.5 实验	第45-46页
2.3 基于共享内存的多进程共享GPU技术	第46-51页
2.3.1 实现原理	第47-48页
2.3.2 实现方法	第48-50页
2.3.3 实验	第50-51页
2.4 本章小结	第51-53页
第三章从千万亿次扩展到百万万亿次编程模型分析	第53-69页
3.1 未来E级系统的发展趋势	第53-55页
3.2 结点间MPI编程和全系统MPI+X混合编程模型分析	第55-57页
3.3 结点内编程模型的需求	第57-58页
3.4 结点内编程模型分析与总结	第58-67页
3.4.1 消息传递	第58-59页
3.4.2 共享存储	第59-61页
3.4.3 单边访问	第61-62页
3.4.4 分布数组	第62-64页
3.4.5 异构模型	第64-66页
3.4.6 国内的研究工作	第66-67页
3.4.7 特征总结	第67页
3.5 本章小结	第67-69页
第四章基于测量的自适应任务划分	第69-83页
4.1 异构计算平台任务划分问题的提出	第69-72页
4.1.1 异构平台科学计算任务平衡划分的重要性	第70-71页
4.1.2 异构平台科学计算任务平衡划分的难点	第71-72页
4.2 基于测量的自适应任务划分	第72-77页
4.2.1 任务划分比率初值设定	第73-74页
4.2.2 划分任务	第74页
4.2.3 更新任务比例数据库	第74-75页
4.2.4 基于测量的自适应任务划分示例分析：矩阵乘	第75-77页
4.3 实验与讨论	第77-81页
4.3.1 GPU/CPU及各CPU核间任务划分比例调整	第78-79页
4.3.2 优化前后性能对比	第79页
4.3.3 多结点实验测试	第79-81页
4.4 本章小结	第81-83页
第五章嵌套双缓冲软件流水技术	第83-93页
5.1 软件流水的提出	第83-86页
5.1.1 CPU与GPU的单边数据通信模型	第83-85页
5.1.2 GPU程序代价模型	第85页
5.1.3 传统双缓冲软件流水执行模型和代价模型	第85-86页
5.1.4 传统方法的不足	第86页
5.2 嵌套双缓冲软件流水	第86-89页
5.2.1 执行模型和代价模型	第86-87页
5.2.2 基于有限状态自动机的高效实现	第87-89页
5.3 Cache旁路的流式数据拷贝优化	第89-90页
5.4 基于天河 -1 平台评测	第90-91页
5.5 本章小结	第91-93页
第六章千万亿次CPU-GPU异构系统LINPACK实现与优化	第93-111页
6.1 千万亿次CPU-GPU异构系统	第93-95页
6.1.1 天河 -1	第93-95页
6.1.2 天河 -1A	第95页
6.2 LINPACK编程	第95-100页
6.2.1 LINPACK算法实现	第96-97页
6.2.2 异构系统LINPACK实现	第97-99页
6.2.3 MPI/Open MP/Streaming编程模型实现	第99-100页
6.3 优化方法	第100-103页
6.3.1 自适应任务划分和嵌套双缓冲软件流水	第100页
6.3.2 MPI/Open MP混合编程方式下SWAP算法优化	第100-102页
6.3.3 结点间GPU空间传输零拷贝和通信优化技术	第102页
6.3.4 传统的通用优化方法	第102-103页
6.4 实验	第103-108页
6.4.1 单进程测试	第103-104页
6.4.2 多进程测试	第104-108页
6.5 本章小结	第108-111页
第七章结论与展望	第111-113页
7.1 论文工作总结	第111-112页
7.2 课题研究展望	第112-113页
致谢	第113-115页
参考文献	第115-129页
作者在学期间取得的学术成果	第129-131页