首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--其他计算机论文

并行程序解析性能模型的自动生成技术研究

摘要第4-5页
Abstract第5-6页
第1章 绪论第10-22页
    1.1 课题背景及研究目的和意义第10-11页
    1.2 相关研究领域的进展与成果第11-19页
        1.2.1 常见程序性能评测方法研究现状第11-16页
        1.2.2 并行编程模型第16页
        1.2.3 辅助分析工具 LLVM第16-17页
        1.2.4 目标应用程序 CGPOP第17-18页
        1.2.5 数据处理工具简介与比较分析第18-19页
    1.3 本文的主要研究内容第19-20页
    1.4 本文的组织结构第20-22页
第2章 性能模型和方案整体设计第22-35页
    2.1 基本概念第22-24页
        2.1.1 程序规模第22-23页
        2.1.2 基本块第23页
        2.1.3 热点基本块第23页
        2.1.4 标准热点基本块第23-24页
        2.1.5 计算模型与通信模型第24页
        2.1.6 strong scaling 与 weak scaling第24页
    2.2 性能模型评测法原型和问题描述第24-26页
        2.2.1 性能模型评测法原型第24-25页
        2.2.2 性能度量角度第25页
        2.2.3 解析性能模型的自动生成问题第25页
        2.2.4 自动生成方案的应用场景第25-26页
    2.3 并行程序的解析性能模型第26-31页
        2.3.1 SPMD 程序特征分析第27页
        2.3.2 计算模型的形式及含义第27-29页
        2.3.3 通信模型的形式及含义第29-30页
        2.3.4 性能模型的跨平台预测能力第30-31页
    2.4 性能模型自动生成方案的整体设计第31-33页
        2.4.1 性能模型自动生成方案的整体流程第31-33页
        2.4.2 性能模型自动生成方案的框架结构第33页
    2.5 本章小结第33-35页
第3章 计算模型的自动生成第35-49页
    3.1 信息采集工具介绍和问题描述第35-40页
        3.1.1 LLVM profiling 功能介绍第35页
        3.1.2 Edge Profiling 信息采集原理第35-38页
        3.1.3 LLVM 修改与配置第38-40页
        3.1.4 计算模型自动生成问题第40页
    3.2 计算模型自动生成模块的设计实现第40-48页
        3.2.1 编译配置模块的设计实现第40-41页
        3.2.2 计算信息采集模块的设计实现第41页
        3.2.3 计算信息处理与数据抽取模块的设计实现第41-45页
        3.2.4 计算模型求解模块的设计实现第45-48页
    3.3 本章小结第48-49页
第4章 通信模型的自动生成第49-58页
    4.1 关键技术分析和问题描述第49-52页
        4.1.1 mpiP 修改与配置第49-50页
        4.1.2 循环结构重构算法第50-51页
        4.1.3 代表进程的选择算法第51-52页
        4.1.4 通信模型的自动生成问题第52页
    4.2 通信模型自动生成模块的设计实现第52-57页
        4.2.1 编译配置模块的设计实现第52页
        4.2.2 通信信息采集模块的设计实现第52-53页
        4.2.3 通信信息处理与数据抽取模块的设计实现第53-56页
        4.2.4 通信模型求解模块的设计实现第56-57页
    4.3 本章小结第57-58页
第5章 CGPOP 性能模型的自动生成与效果评测第58-71页
    5.1 实验配置第58-60页
        5.1.1 实验平台介绍第58页
        5.1.2 程序规模设置第58-59页
        5.1.3 阈值设置第59页
        5.1.4 CGPOP 编译选项配置第59-60页
    5.2 性能模型生成过程及相关数据第60-66页
        5.2.1 计算模型的生成过程及数据第60-64页
        5.2.2 通信模型的生成过程及数据第64-66页
    5.3 评测效果及误差分析第66-70页
        5.3.1 性能模型对已知情况的评测效果第66-68页
        5.3.2 性能模型对未知情况的预测效果第68-70页
    5.4 本章小结第70-71页
结论第71-72页
参考文献第72-76页
攻读硕士学位期间发表的论文及其他成果第76-78页
致谢第78页

论文共78页,点击 下载论文
上一篇:基于SATA的高速大容量固态存储技术
下一篇:基于运动想象的异步脑机接口系统的研究