首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

科学计算程序性能分析与优化关键技术研究

摘要第1-10页
ABSTRACT第10-12页
第一章 绪论第12-29页
 §1.1 引言第12-17页
     ·高性能计算机体系结构第12-16页
     ·科学计算面临的性能问题第16-17页
 §1.2 程序性能优化现状第17-23页
     ·相关概念与术语第17-19页
     ·存储优化研究现状第19-21页
     ·ILP优化研究现状第21页
     ·存储与ILP优化结合研究现状第21-22页
     ·几个研究热点第22-23页
     ·相关学术机构、刊物与会议第23页
 §1.3 程序性能测试与分析研究现状第23-25页
     ·程序性能测试技术第23-25页
     ·程序性能特征分析技术第25页
     ·相关学术刊物与会议第25页
 §1.4 本文的研究内容与研究贡献第25-27页
     ·存在问题与研究内容第25-26页
     ·研究贡献第26-27页
     ·几点说明第27页
 §1.5 本文内容的安排第27-29页
第二章 基于有限执行与遗传算法的程序性能优化参数选择第29-64页
 §2.1 问题的提出第29-33页
     ·循环分块第29-30页
     ·数组Padding第30-31页
     ·循环展开第31-33页
 §2.2 已有工作及存在问题第33-38页
     ·已有工作第33-35页
     ·存在问题第35-38页
 §2.3 基于有限执行与遗传算法的优化参数选择框架Lega第38-54页
     ·问题的形式化定义第39页
     ·Lega的总体框架流程第39-40页
     ·参数化第40-41页
     ·程序缩减变换第41-49页
     ·执行驱动的参数搜索算法Edga第49-54页
 §2.4 实验结果与讨论第54-63页
     ·实验平台第54页
     ·遗传搜索过程收敛情况第54-55页
     ·平台自适应性第55-57页
     ·与DAT和迭代编译在参数选择质量上的比较第57-60页
     ·参数选择开销第60-63页
 §2.5 本章小结第63-64页
     ·主要工作第63页
     ·方法评述第63-64页
第三章 基于硬件性能监视的程序性能测试与分析第64-77页
 §3.1 引言第64-68页
     ·程序性能数据获取方法第64-66页
     ·硬件性能监视原理及软硬件技术第66-68页
 §3.2 基于硬件计数器的程序性能测试与分析软件PTracker第68-73页
     ·P6系列处理器的硬件性能监视与WinPAPI第68-69页
     ·PTracker的设计思想第69页
     ·PTracker的结构及实现第69-70页
     ·PTracker的几种测试模式第70-71页
     ·PTracker中的数据分析第71-73页
 §3.3 PTracker应用实例第73-76页
     ·矩阵相乘程序优化第73-75页
     ·SPEC CPU2000部分浮点程序性能特征分析第75-76页
 §3.4 本章小结第76-77页
第四章 JACOBI迭代程序的存储局部性优化与分析第77-89页
 §4.1 引言第77-78页
 §4.2 三种优化方法概况第78-82页
     ·InterNest第78-79页
     ·TimeSkew第79-80页
     ·NewTile第80-82页
 §4.3 性能分析第82-86页
     ·假设与标记第82页
     ·开销的组成第82-83页
     ·程序的cache不命中数第83-84页
     ·通信开销第84-85页
     ·时间开销综合第85-86页
 §4.4 实验结果与讨论第86-88页
 §4.5 本章小结第88-89页
第五章 CFD业务程序LM3D的性能优化第89-98页
 §5.1 引言第89-90页
 §5.2 优化方法与过程第90-94页
     ·程序时间Profiling第90-91页
     ·程序变换第91-92页
     ·关键输入值嵌入第92-94页
 §5.3 实验结果及分析第94-97页
     ·实验设置第94页
     ·实验结果第94-97页
 §5.4 本章小结第97-98页
第六章 基于硬件计数器的MPEG4视频应用性能特征分析第98-106页
 §6.1 引言第98页
 §6.2 相关工作第98-99页
 §6.3 方法第99-101页
     ·目标平台第99-100页
     ·MPEG4视频应用第100页
     ·实验过程第100-101页
 §6.4 实验结果及分析第101-105页
     ·指令比例第101-102页
     ·指令执行速率第102页
     ·cache不命中率第102-103页
     ·存储带宽需求第103页
     ·程序平衡第103-104页
     ·分支预测第104页
     ·性能影响率第104-105页
 §6.5 本章小结第105-106页
第七章 研究工作总结与展望第106-108页
 §7.1 本文研究工作的总结第106页
 §7.2 研究展望第106-108页
攻读博士学位期间发表的论文第108页
攻读博士学位期间参加的科研工作第108-109页
致谢第109-110页
参考文献第110-120页
附录A 本文用到的PAPI参数的含义第120页

论文共120页,点击 下载论文
上一篇:采用相互作用方法进行听力教学——实验报告
下一篇:有关我国管理层收购若干问题研究