首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--编译程序、解释程序论文

面向高效能计算的编译关键技术:精度、性能与功耗

摘要第1-14页
ABSTRACT第14-16页
第一章 绪论第16-30页
   ·引言第16-17页
   ·相关工作第17-25页
     ·高精度浮点运算的实现第17-20页
     ·面向高精度运算的编译器和编译优化第20-23页
     ·低功耗优化技术第23-25页
   ·论文的主要工作与创新第25-27页
     ·主要研究内容第25-26页
     ·主要创新点第26-27页
   ·论文结构第27-30页
第二章 面向高效能计算的高精度编译技术第30-70页
   ·扩展双精度浮点运算的硬件支持第30-36页
     ·Intel IA-64对扩展双精度浮点运算的支持第31-34页
     ·Intel 64与IA-32对扩展双精度浮点运算的支持第34-36页
   ·扩展双精度浮点运算的语法第36-38页
     ·扩展双精度浮点数据表示第36-37页
     ·内部函数与标准数学库函数名字约定第37页
     ·扩展双精度浮点数据的输出格式第37-38页
   ·扩展双精度程序的编译实现第38-41页
     ·编译前端第38-39页
     ·编译中端与RTL生成第39页
     ·编译后端第39-40页
     ·机器描述第40页
     ·FORTRAN内部函数库与I/O库第40-41页
   ·扩展双精度浮点运算函数库第41-58页
     ·乘幂运算展开第41-49页
     ·除法与方根内联第49-52页
     ·指数函数内联第52-58页
   ·扩展双精度浮点运算并行支持第58-62页
     ·MPI编程接口与MPI实现第58页
     ·基于MPICH2的扩展双精度浮点并行计算第58-60页
     ·基于其它系统的扩展双精度浮点并行计算第60-62页
   ·扩展双精度浮点运算的功能验证第62-65页
     ·计算π的BBP算法第62-64页
     ·用BBP算法测试扩展双精度浮点运算的功能第64-65页
   ·扩展双精度浮点运算的性能测试第65-69页
     ·与Intel编译器的四倍精度浮点运算性能对比测试第65-66页
     ·与Intel编译器的双精度浮点运算性能对比测试第66页
     ·扩展双精度数学库函数内联优化效果测试与分析第66-67页
     ·扩展双精度与双精度浮点运算性能对比与分析第67-69页
   ·小结第69-70页
第三章 面向高效能计算的高性能编译技术第70-108页
   ·针对FORTRAN语言特点的别名分析第70-72页
     ·FORTRAN语言中的别名第70-71页
     ·针对FORTRAN语言特点的别名分析第71-72页
     ·针对FORTRAN语言特点的别名分析优化效果第72页
   ·自动函数内联第72-75页
     ·自动函数内联算法第73-74页
     ·自动函数内联优化效果第74-75页
   ·循环变换第75-81页
     ·循环变换与数据依赖关系分析技术第75-76页
     ·GCC中的数据依赖关系分析第76页
     ·改进GCC中的数据依赖关系分析第76-80页
     ·循环变换优化效果第80-81页
   ·数据预取第81-92页
     ·数据预取技术第82-83页
     ·IA-64 Cache与预取支持第83-85页
     ·GCC中的数据预取第85-86页
     ·改进GCC中的数据预取第86-89页
     ·数据预取优化效果第89-92页
   ·存取地址后增指令优化第92-94页
     ·归纳变量优化与存取地址后增指令第92-93页
     ·GCC中的归纳变量优化第93页
     ·改进GCC中的归纳变量优化第93-94页
     ·存取地址后增指令优化效果第94页
   ·软流水调度第94-102页
     ·软流水调度技术第94-95页
     ·资源模型第95-96页
     ·基于DFA资源模型的模调度算法第96-101页
     ·软流水调度优化效果第101-102页
   ·性能评测第102-106页
     ·串行性能测试第102-104页
     ·并行性能测试第104-106页
   ·小结第106-108页
第四章 面向高效能计算的低功耗技术第108-124页
   ·功耗基础第108-110页
     ·功耗组成第109页
     ·功耗分布第109-110页
   ·基于MPI程序的低功耗优化技术第110-122页
     ·基于MPI_Barrier操作的低功耗优化第111-117页
     ·基于MPI_Reduce和MPI_Bcast操作的低功耗优化第117-122页
   ·小结第122-124页
第五章 结束语第124-126页
   ·论文的主要贡献和创新点第124-125页
   ·进一步的工作第125-126页
致谢第126-128页
参考文献第128-142页
作者在攻读博士学位期间取得的学术成果第142-143页
 发表的论文第142-143页
 获得的科技奖励第143页
 参加的科研工作第143页

论文共143页,点击 下载论文
上一篇:劳动法学理论的新发展--以企业社会责任理论的引入为视角
下一篇:一种改进的DNA计算模型研究