首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

通用多核集群上的并行调优策略研究

摘要第1-8页
ABSTRACT第8-10页
第1章 绪论第10-18页
   ·当前主流大规模并行计算平台第10-12页
     ·多核的兴起第10-11页
     ·多核构架的新特性第11页
     ·多核构架与主流大规模并行计算平台第11-12页
   ·并行调优策略的重要性第12-14页
     ·并行调优技术的困境第12-13页
     ·并行调优策略的重要性第13-14页
   ·并行调优策略相关技术第14-16页
     ·性能建模第14-15页
     ·性能预测第15页
     ·自优化技术第15页
     ·性能测试第15-16页
   ·本文贡献与结构安排第16-18页
第2章 实验平台第18-26页
   ·体系结构概述第18-23页
     ·Harpertown-Infiniband/DDR第19-21页
     ·Nehalem-Infiniband/DDR第21-22页
     ·Barcelona-Quadrics/Elan4第22-23页
   ·编程模型第23-24页
   ·编程环境第24-25页
   ·计时方式第25页
   ·性能表示方式第25-26页
第3章 目标程序特征分析与适用优化第26-41页
   ·Stencil计算第26-29页
     ·MG第26-28页
     ·Line-Sweep计算第28-29页
   ·FMM第29-34页
     ·N-Body问题及FMM算法第29-30页
     ·PetFMM数据结构分析第30-33页
     ·PetFMM算法流程分析第33-34页
   ·目标应用程序常见优化第34-41页
     ·寄存器分块第34-35页
     ·SIMD第35页
     ·强度削弱第35-36页
     ·NUMA内存分配第36-37页
     ·软件数据预取第37页
     ·高速缓存分块第37-38页
     ·数组填充第38-39页
     ·数组元素重排列第39页
     ·循环融合第39-40页
     ·内存直写第40页
     ·计算与通讯覆盖第40-41页
第4章 基于静态分析和微测试程序的并行调优策略第41-46页
   ·影响程序性能的主要因素第41-42页
   ·当前主流并行调优策略第42页
   ·我们的并行调优策略第42-46页
第5章 微测试程序设计与实验数据分析第46-66页
   ·访存性能测试第46-54页
     ·访存微测试程序Stream的缺点第46-47页
     ·访存微测试程序MemPattern的设计第47-49页
     ·测试结果及其分析第49-54页
   ·通讯性能测试第54-66页
     ·通讯微测试程序CommPattern的设计第55-56页
     ·测试结果及其分析第56-66页
第6章 Stencil计算与PetFMM并行调优第66-80页
   ·MG第66-69页
   ·Line-Sweep计算第69-75页
   ·PetFMM第75-80页
     ·PetFMM各阶段计算与访存特性第76-77页
     ·PetFMM各阶段优化组合的静态评估第77-80页
第7章 多重数据划分算法分析与改进第80-97页
   ·基本概念第80-81页
     ·通用符号第80-81页
     ·数据划分第81页
   ·均衡数据划分第81-84页
   ·均衡数据划分生成算法第84-93页
     ·目标函数第84-85页
     ·确定数据划分向量第85-89页
     ·确定处理机分配第89-93页
   ·实例及其性能分析第93-95页
   ·实验数据与分析第95-97页
第8章 总结第97-100页
   ·结论第97-98页
   ·将来的工作第98-100页
参考文献第100-108页
发表论文目录第108-109页
致谢第109-110页

论文共110页,点击 下载论文
上一篇:神经导航中磁共振弥散张量图像处理技术的研究
下一篇:领域专用可重构计算结构研究