FT64流处理技术:体系结构、编程语言、编译技术及编程方法
| 摘要 | 第1-14页 |
| ABSTRACT | 第14-16页 |
| 第一章 绪论 | 第16-30页 |
| ·课题研究背景 | 第16-18页 |
| ·高性能计算体系结构 | 第16页 |
| ·流体系结构 | 第16-18页 |
| ·课题研究内容 | 第18-20页 |
| ·课题来源 | 第18页 |
| ·课题研究重点 | 第18-19页 |
| ·课题研究难点 | 第19-20页 |
| ·相关工作 | 第20-27页 |
| ·流体系结构 | 第20-26页 |
| ·流编程语言及其编译器 | 第26-27页 |
| ·本文的主要工作和创新 | 第27-28页 |
| ·论文结构 | 第28-30页 |
| 第二章 FT64流处理器 | 第30-45页 |
| ·FT64流处理器体系结构 | 第30-31页 |
| ·基于FT64的并行系统体系结构 | 第31-32页 |
| ·FT64流处理器的实现 | 第32-45页 |
| ·指令集系统 | 第33-35页 |
| ·流控制器 | 第35-37页 |
| ·微码控制器 | 第37-39页 |
| ·计算簇 | 第39-40页 |
| ·存储层次 | 第40-41页 |
| ·网络接口和主机接口 | 第41-45页 |
| 第三章 SF95流编程语言 | 第45-57页 |
| ·流级程序指导命令 | 第46-48页 |
| ·核级程序指导命令 | 第48-54页 |
| ·核级程序块指导命令KBB和KBE | 第48-51页 |
| ·核级循环指导命令KLP | 第51-53页 |
| ·流拷贝指导命令SCP | 第53-54页 |
| ·优化指导命令 | 第54-57页 |
| ·流级循环展开指导命令SUR | 第54-55页 |
| ·归约指导命令RDT | 第55页 |
| ·核级循环展开指导命令KUR | 第55-56页 |
| ·核级软流水指导命令KPL | 第56-57页 |
| 第四章 SF95Compiler | 第57-72页 |
| ·流变换 | 第57-62页 |
| ·流生成 | 第57-59页 |
| ·循环流化 | 第59-60页 |
| ·向量流化 | 第60-61页 |
| ·分支转换 | 第61-62页 |
| ·归约识别 | 第62页 |
| ·代码优化 | 第62-64页 |
| ·基流复用 | 第62-63页 |
| ·派生流复用 | 第63-64页 |
| ·计算核心合并 | 第64页 |
| ·超越函数库 | 第64-72页 |
| ·改进的多项式逼近算法 | 第65-68页 |
| ·FT64上的算法实现 | 第68-70页 |
| ·在FT64上的超越函数测试结果 | 第70-72页 |
| 第五章 基于SF95的流化理论 | 第72-89页 |
| ·向量执行模型、并行执行模型与流执行模型 | 第72-73页 |
| ·循环可流化的定义 | 第73-75页 |
| ·循环可流化的判定条件 | 第75-80页 |
| ·可向量化、可并行化与可流化 | 第80-83页 |
| ·程序变换技术与可流化 | 第83-89页 |
| ·索引变量替换 | 第83页 |
| ·语句重排序 | 第83-84页 |
| ·循环分裂 | 第84页 |
| ·循环展开 | 第84-85页 |
| ·循环联合 | 第85页 |
| ·循环分布 | 第85-86页 |
| ·循环合并 | 第86页 |
| ·循环置换 | 第86-87页 |
| ·标量和数组扩张 | 第87-88页 |
| ·循环软流水 | 第88-89页 |
| 第六章 实验 | 第89-99页 |
| ·测试用例介绍 | 第89-94页 |
| ·Swim | 第89-90页 |
| ·EP | 第90-91页 |
| ·MG | 第91页 |
| ·CG | 第91页 |
| ·FFT | 第91-92页 |
| ·Laplace | 第92页 |
| ·Jacobi | 第92-93页 |
| ·GEMM | 第93-94页 |
| ·NLAG-5 | 第94页 |
| ·评测结果 | 第94-99页 |
| 第七章 结束语 | 第99-102页 |
| ·工作总结 | 第99-100页 |
| ·研究展望 | 第100-102页 |
| 致谢 | 第102-103页 |
| 参考文献 | 第103-110页 |
| 攻读博士学位期间已发表和待发表的论文 | 第110-111页 |
| 攻读博士学位期间参与的科研项目 | 第111页 |