摘要 | 第1-14页 |
ABSTRACT | 第14-16页 |
第一章 绪论 | 第16-30页 |
·引言 | 第16-17页 |
·相关工作 | 第17-25页 |
·高精度浮点运算的实现 | 第17-20页 |
·面向高精度运算的编译器和编译优化 | 第20-23页 |
·低功耗优化技术 | 第23-25页 |
·论文的主要工作与创新 | 第25-27页 |
·主要研究内容 | 第25-26页 |
·主要创新点 | 第26-27页 |
·论文结构 | 第27-30页 |
第二章 面向高效能计算的高精度编译技术 | 第30-70页 |
·扩展双精度浮点运算的硬件支持 | 第30-36页 |
·Intel IA-64对扩展双精度浮点运算的支持 | 第31-34页 |
·Intel 64与IA-32对扩展双精度浮点运算的支持 | 第34-36页 |
·扩展双精度浮点运算的语法 | 第36-38页 |
·扩展双精度浮点数据表示 | 第36-37页 |
·内部函数与标准数学库函数名字约定 | 第37页 |
·扩展双精度浮点数据的输出格式 | 第37-38页 |
·扩展双精度程序的编译实现 | 第38-41页 |
·编译前端 | 第38-39页 |
·编译中端与RTL生成 | 第39页 |
·编译后端 | 第39-40页 |
·机器描述 | 第40页 |
·FORTRAN内部函数库与I/O库 | 第40-41页 |
·扩展双精度浮点运算函数库 | 第41-58页 |
·乘幂运算展开 | 第41-49页 |
·除法与方根内联 | 第49-52页 |
·指数函数内联 | 第52-58页 |
·扩展双精度浮点运算并行支持 | 第58-62页 |
·MPI编程接口与MPI实现 | 第58页 |
·基于MPICH2的扩展双精度浮点并行计算 | 第58-60页 |
·基于其它系统的扩展双精度浮点并行计算 | 第60-62页 |
·扩展双精度浮点运算的功能验证 | 第62-65页 |
·计算π的BBP算法 | 第62-64页 |
·用BBP算法测试扩展双精度浮点运算的功能 | 第64-65页 |
·扩展双精度浮点运算的性能测试 | 第65-69页 |
·与Intel编译器的四倍精度浮点运算性能对比测试 | 第65-66页 |
·与Intel编译器的双精度浮点运算性能对比测试 | 第66页 |
·扩展双精度数学库函数内联优化效果测试与分析 | 第66-67页 |
·扩展双精度与双精度浮点运算性能对比与分析 | 第67-69页 |
·小结 | 第69-70页 |
第三章 面向高效能计算的高性能编译技术 | 第70-108页 |
·针对FORTRAN语言特点的别名分析 | 第70-72页 |
·FORTRAN语言中的别名 | 第70-71页 |
·针对FORTRAN语言特点的别名分析 | 第71-72页 |
·针对FORTRAN语言特点的别名分析优化效果 | 第72页 |
·自动函数内联 | 第72-75页 |
·自动函数内联算法 | 第73-74页 |
·自动函数内联优化效果 | 第74-75页 |
·循环变换 | 第75-81页 |
·循环变换与数据依赖关系分析技术 | 第75-76页 |
·GCC中的数据依赖关系分析 | 第76页 |
·改进GCC中的数据依赖关系分析 | 第76-80页 |
·循环变换优化效果 | 第80-81页 |
·数据预取 | 第81-92页 |
·数据预取技术 | 第82-83页 |
·IA-64 Cache与预取支持 | 第83-85页 |
·GCC中的数据预取 | 第85-86页 |
·改进GCC中的数据预取 | 第86-89页 |
·数据预取优化效果 | 第89-92页 |
·存取地址后增指令优化 | 第92-94页 |
·归纳变量优化与存取地址后增指令 | 第92-93页 |
·GCC中的归纳变量优化 | 第93页 |
·改进GCC中的归纳变量优化 | 第93-94页 |
·存取地址后增指令优化效果 | 第94页 |
·软流水调度 | 第94-102页 |
·软流水调度技术 | 第94-95页 |
·资源模型 | 第95-96页 |
·基于DFA资源模型的模调度算法 | 第96-101页 |
·软流水调度优化效果 | 第101-102页 |
·性能评测 | 第102-106页 |
·串行性能测试 | 第102-104页 |
·并行性能测试 | 第104-106页 |
·小结 | 第106-108页 |
第四章 面向高效能计算的低功耗技术 | 第108-124页 |
·功耗基础 | 第108-110页 |
·功耗组成 | 第109页 |
·功耗分布 | 第109-110页 |
·基于MPI程序的低功耗优化技术 | 第110-122页 |
·基于MPI_Barrier操作的低功耗优化 | 第111-117页 |
·基于MPI_Reduce和MPI_Bcast操作的低功耗优化 | 第117-122页 |
·小结 | 第122-124页 |
第五章 结束语 | 第124-126页 |
·论文的主要贡献和创新点 | 第124-125页 |
·进一步的工作 | 第125-126页 |
致谢 | 第126-128页 |
参考文献 | 第128-142页 |
作者在攻读博士学位期间取得的学术成果 | 第142-143页 |
发表的论文 | 第142-143页 |
获得的科技奖励 | 第143页 |
参加的科研工作 | 第143页 |