摘要 | 第1-9页 |
ABSTRACT | 第9-10页 |
第一章 绪论 | 第10-17页 |
§1.1 课题研究背景 | 第10-11页 |
§1.2 并行计算与并行程序性能分析技术的研究现状 | 第11-15页 |
·并行计算的发展 | 第11-12页 |
·并行程序性能分析技术的发展 | 第12-15页 |
·性能分析模型 | 第13页 |
·性能分析工具的研究 | 第13-14页 |
·其他相关技术的研究 | 第14-15页 |
§1.3 课题研究内容和成果 | 第15-16页 |
·主要研究内容 | 第15-16页 |
·课题研究成果 | 第16页 |
§1.4 论文组织 | 第16-17页 |
第二章 并行程序性能分析技术研究 | 第17-35页 |
§2.1 并行计算机与并行程序设计 | 第17-21页 |
·并行计算机 | 第17-19页 |
·并行计算机存储器访问模式 | 第19-20页 |
·并行程序设计 | 第20-21页 |
§2.2 并行程序性能分析技术研究 | 第21-34页 |
·并行算法性能分析 | 第22-24页 |
·并行算法性能度量 | 第22-23页 |
·并行计算模型 | 第23-24页 |
·开销分析 | 第24-27页 |
·时间开销 | 第25-26页 |
·空间开销 | 第26-27页 |
·消息传递并行程序性能分析技术研究 | 第27-29页 |
·基于事件的分析方法 | 第27-28页 |
·性能分析模型 | 第28-29页 |
·共享存储器并行程序性能分析技术研究 | 第29-32页 |
·OpenMP程序开销分析 | 第29-31页 |
·性能分析模型 | 第31-32页 |
·面向IA-64的性能分析技术 | 第32-34页 |
·IA-64体系结构特征分析 | 第32-33页 |
·应用程序性能评价 | 第33页 |
·度量方法 | 第33-34页 |
§2.3 小结 | 第34-35页 |
第三章 并行程序性能分析工具AutoPAN的设计与实现 | 第35-57页 |
§3.1 总体设计方案与系统体系结构 | 第35-36页 |
§3.2 MPI性能分析模块实现——AIMS改进与移植 | 第36-44页 |
·AIMS实现技术研究 | 第36-44页 |
·系统构成与工作原理 | 第36-38页 |
·事件跟踪技术 | 第38页 |
·源代码插桩模块 | 第38-39页 |
·性能监测函数库 | 第39-42页 |
·各类控制函数 | 第42-44页 |
·改进与移植 | 第44页 |
§3.3 OpenMP性能分析模块的设计与实现 | 第44-56页 |
·指导语句重写与代码插桩 | 第44-51页 |
·指导语句重写 | 第45-49页 |
·OpenMP库例程与用户程序单元插桩 | 第49页 |
·数据结构定义与主要函数实现 | 第49-51页 |
·硬件计数器与性能数据采集 | 第51-53页 |
·硬件计数器访问接口PAPI | 第52页 |
·硬件计数器与性能数据采集 | 第52-53页 |
·性能监测函数库 | 第53-55页 |
·主要数据结构定义 | 第53-54页 |
·性能监测函数 | 第54-55页 |
·控制接口 | 第55-56页 |
·初始化与结束处理 | 第55-56页 |
·计数器控制 | 第56页 |
§3.4 小结 | 第56-57页 |
第四章 测试与分析 | 第57-62页 |
§4.1 实验环境 | 第57页 |
§4.2 MPI程序测试 | 第57-59页 |
·命令行测试: | 第57-58页 |
·图形界面测试: | 第58-59页 |
§4.3 OpenMP程序测试 | 第59-61页 |
§4.4 小结 | 第61-62页 |
第五章 结束语 | 第62-63页 |
致谢 | 第63-65页 |
附录:作者攻读硕士期间发表的论文 | 第65-66页 |
参考文献 | 第66-67页 |