| 摘要 | 第1-14页 |
| ABSTRACT | 第14-16页 |
| 第一章 绪论 | 第16-30页 |
| ·引言 | 第16-17页 |
| ·相关工作 | 第17-25页 |
| ·高精度浮点运算的实现 | 第17-20页 |
| ·面向高精度运算的编译器和编译优化 | 第20-23页 |
| ·低功耗优化技术 | 第23-25页 |
| ·论文的主要工作与创新 | 第25-27页 |
| ·主要研究内容 | 第25-26页 |
| ·主要创新点 | 第26-27页 |
| ·论文结构 | 第27-30页 |
| 第二章 面向高效能计算的高精度编译技术 | 第30-70页 |
| ·扩展双精度浮点运算的硬件支持 | 第30-36页 |
| ·Intel IA-64对扩展双精度浮点运算的支持 | 第31-34页 |
| ·Intel 64与IA-32对扩展双精度浮点运算的支持 | 第34-36页 |
| ·扩展双精度浮点运算的语法 | 第36-38页 |
| ·扩展双精度浮点数据表示 | 第36-37页 |
| ·内部函数与标准数学库函数名字约定 | 第37页 |
| ·扩展双精度浮点数据的输出格式 | 第37-38页 |
| ·扩展双精度程序的编译实现 | 第38-41页 |
| ·编译前端 | 第38-39页 |
| ·编译中端与RTL生成 | 第39页 |
| ·编译后端 | 第39-40页 |
| ·机器描述 | 第40页 |
| ·FORTRAN内部函数库与I/O库 | 第40-41页 |
| ·扩展双精度浮点运算函数库 | 第41-58页 |
| ·乘幂运算展开 | 第41-49页 |
| ·除法与方根内联 | 第49-52页 |
| ·指数函数内联 | 第52-58页 |
| ·扩展双精度浮点运算并行支持 | 第58-62页 |
| ·MPI编程接口与MPI实现 | 第58页 |
| ·基于MPICH2的扩展双精度浮点并行计算 | 第58-60页 |
| ·基于其它系统的扩展双精度浮点并行计算 | 第60-62页 |
| ·扩展双精度浮点运算的功能验证 | 第62-65页 |
| ·计算π的BBP算法 | 第62-64页 |
| ·用BBP算法测试扩展双精度浮点运算的功能 | 第64-65页 |
| ·扩展双精度浮点运算的性能测试 | 第65-69页 |
| ·与Intel编译器的四倍精度浮点运算性能对比测试 | 第65-66页 |
| ·与Intel编译器的双精度浮点运算性能对比测试 | 第66页 |
| ·扩展双精度数学库函数内联优化效果测试与分析 | 第66-67页 |
| ·扩展双精度与双精度浮点运算性能对比与分析 | 第67-69页 |
| ·小结 | 第69-70页 |
| 第三章 面向高效能计算的高性能编译技术 | 第70-108页 |
| ·针对FORTRAN语言特点的别名分析 | 第70-72页 |
| ·FORTRAN语言中的别名 | 第70-71页 |
| ·针对FORTRAN语言特点的别名分析 | 第71-72页 |
| ·针对FORTRAN语言特点的别名分析优化效果 | 第72页 |
| ·自动函数内联 | 第72-75页 |
| ·自动函数内联算法 | 第73-74页 |
| ·自动函数内联优化效果 | 第74-75页 |
| ·循环变换 | 第75-81页 |
| ·循环变换与数据依赖关系分析技术 | 第75-76页 |
| ·GCC中的数据依赖关系分析 | 第76页 |
| ·改进GCC中的数据依赖关系分析 | 第76-80页 |
| ·循环变换优化效果 | 第80-81页 |
| ·数据预取 | 第81-92页 |
| ·数据预取技术 | 第82-83页 |
| ·IA-64 Cache与预取支持 | 第83-85页 |
| ·GCC中的数据预取 | 第85-86页 |
| ·改进GCC中的数据预取 | 第86-89页 |
| ·数据预取优化效果 | 第89-92页 |
| ·存取地址后增指令优化 | 第92-94页 |
| ·归纳变量优化与存取地址后增指令 | 第92-93页 |
| ·GCC中的归纳变量优化 | 第93页 |
| ·改进GCC中的归纳变量优化 | 第93-94页 |
| ·存取地址后增指令优化效果 | 第94页 |
| ·软流水调度 | 第94-102页 |
| ·软流水调度技术 | 第94-95页 |
| ·资源模型 | 第95-96页 |
| ·基于DFA资源模型的模调度算法 | 第96-101页 |
| ·软流水调度优化效果 | 第101-102页 |
| ·性能评测 | 第102-106页 |
| ·串行性能测试 | 第102-104页 |
| ·并行性能测试 | 第104-106页 |
| ·小结 | 第106-108页 |
| 第四章 面向高效能计算的低功耗技术 | 第108-124页 |
| ·功耗基础 | 第108-110页 |
| ·功耗组成 | 第109页 |
| ·功耗分布 | 第109-110页 |
| ·基于MPI程序的低功耗优化技术 | 第110-122页 |
| ·基于MPI_Barrier操作的低功耗优化 | 第111-117页 |
| ·基于MPI_Reduce和MPI_Bcast操作的低功耗优化 | 第117-122页 |
| ·小结 | 第122-124页 |
| 第五章 结束语 | 第124-126页 |
| ·论文的主要贡献和创新点 | 第124-125页 |
| ·进一步的工作 | 第125-126页 |
| 致谢 | 第126-128页 |
| 参考文献 | 第128-142页 |
| 作者在攻读博士学位期间取得的学术成果 | 第142-143页 |
| 发表的论文 | 第142-143页 |
| 获得的科技奖励 | 第143页 |
| 参加的科研工作 | 第143页 |