流体系结构的编译技术研究--面向科学计算程序的编译优化
摘要 | 第1-17页 |
ABSTRACT | 第17-20页 |
第一章 绪论 | 第20-40页 |
·课题研究背景 | 第20-24页 |
·高性能体系结构面临的问题 | 第20-21页 |
·流体系结构和流编程模型的性能优势 | 第21-22页 |
·科学计算程序的需求 | 第22-23页 |
·基于流体系结构和流编程模型加速科学计算程序 | 第23-24页 |
·课题研究内容 | 第24-28页 |
·课题来源 | 第24页 |
·课题研究重点 | 第24-27页 |
·课题研究难点 | 第27-28页 |
·相关研究工作 | 第28-36页 |
·流体系结构 | 第28-31页 |
·流编程模型和编译系统 | 第31-33页 |
·传统编译优化技术 | 第33-36页 |
·论文的主要工作和创新 | 第36-38页 |
·论文结构 | 第38-40页 |
第二章 Imagine上面向科学计算的编译框架 | 第40-56页 |
·Imagine流处理系统 | 第40-47页 |
·Imagine流体系结构 | 第40-43页 |
·Imagine流编程模型 | 第43-45页 |
·Imagine流编译系统 | 第45页 |
·Imagine的性能潜力 | 第45-47页 |
·面向科学计算的流编程和编译技术 | 第47-54页 |
·科学计算程序对流编程和编译的挑战 | 第47-49页 |
·SF95流编程语言 | 第49-52页 |
·SF95Compiler流编译器 | 第52-54页 |
·小结 | 第54-56页 |
第三章 基于D&C矩阵的优化流变换技术 | 第56-82页 |
·问题的提出 | 第56-58页 |
·相关工作 | 第58-59页 |
·D&C矩阵 | 第59-61页 |
·基于D&C矩阵的优化流变换 | 第61-72页 |
·粗粒度程序变换 | 第61-65页 |
·细粒度程序变换 | 第65-69页 |
·数据流组织优化 | 第69-72页 |
·编译实现 | 第72-75页 |
·实验评测 | 第75-81页 |
·粗粒度程序变换评测 | 第77-78页 |
·细粒度程序变换评测 | 第78-79页 |
·数据流组织优化评测 | 第79-81页 |
·小结 | 第81-82页 |
第四章 基于参数模型的长流分段技术 | 第82-108页 |
·问题的提出 | 第82-83页 |
·相关工作 | 第83-84页 |
·基本框架 | 第84-85页 |
·基于参数模型的长流分段 | 第85-99页 |
·建立参数模型 | 第85-86页 |
·计算密集型程序的分段 | 第86-91页 |
·访存密集型程序的分段 | 第91-96页 |
·任意程序的分段 | 第96-99页 |
·编译实现 | 第99-104页 |
·算法实现 | 第100-101页 |
·优化策略的选择 | 第101-104页 |
·实验评测 | 第104-106页 |
·小结 | 第106-108页 |
第五章 开发计算核心内的计算与访存重叠 | 第108-138页 |
·问题的提出 | 第108-109页 |
·相关工作 | 第109-111页 |
·经验策略 | 第111-116页 |
·程序建模 | 第111-115页 |
·策略实现 | 第115-116页 |
·长流策略 | 第116-124页 |
·程序建模 | 第116-119页 |
·策略实现 | 第119-124页 |
·最优策略 | 第124-129页 |
·研究思路 | 第124-125页 |
·分段决策 | 第125-127页 |
·策略实现 | 第127-129页 |
·实验评测 | 第129-136页 |
·小规模程序 | 第130-132页 |
·大规模程序 | 第132-136页 |
·小结 | 第136-138页 |
第六章 开发计算核心间的数据流重用 | 第138-184页 |
·问题的提出 | 第138-139页 |
·相关工作 | 第139-142页 |
·存储重用 | 第139-140页 |
·重用优化 | 第140-142页 |
·开发核间的长流重用 | 第142-155页 |
·重用指导的kernel重排序 | 第143-150页 |
·重用优化的kernel集合 | 第150-153页 |
·重用驱动的长流分段 | 第153-155页 |
·开发核间的部分重用 | 第155-177页 |
·重要概念 | 第156-161页 |
·基本思想 | 第161-164页 |
·识别kernel间部分重用 | 第164-174页 |
·开发kernel间部分重用 | 第174-177页 |
·编译实现 | 第177-178页 |
·实验评测 | 第178-183页 |
·小结 | 第183-184页 |
第七章 典型科学计算库函数的优化与实现 | 第184-216页 |
·问题的提出 | 第184-185页 |
·相关工作 | 第185页 |
·Jacobi | 第185-195页 |
·流化方法 | 第186-192页 |
·实验评测 | 第192-195页 |
·GEMM | 第195-200页 |
·流化方法 | 第195-198页 |
·实验评测 | 第198-200页 |
·Transp | 第200-206页 |
·流化方法 | 第201-204页 |
·实验评测 | 第204-206页 |
·Laplace | 第206-209页 |
·流化方法 | 第206-208页 |
·实验评测 | 第208-209页 |
·Swim | 第209-214页 |
·流化方法 | 第210-211页 |
·实验评测 | 第211-214页 |
·小结 | 第214-216页 |
第八章 总结与未来工作 | 第216-220页 |
·工作总结 | 第216-217页 |
·研究展望 | 第217-220页 |
致谢 | 第220-224页 |
攻读博士学位期间发表的论文 | 第224-228页 |
攻读博士学位期间参加的主要科研工作 | 第228-230页 |
参考文献 | 第230-239页 |