首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--编译程序、解释程序论文

前瞻多线程编译优化技术的研究与实现

中文摘要第1-11页
英文摘要第11-13页
第1章 绪论第13-20页
 §1.1 研究背景第13-16页
  1.1.1 超标量结构的概况与局限第13-14页
  1.1.2 ILP的潜力和限制第14-16页
 §1.2 多线程结构与线程级并行第16-17页
 §1.3 延迟隐藏技术第17-18页
 §1.4 本文的工作第18-19页
 §1.5 本文的结构第19-20页
第2章 相关研究现状第20-35页
 §2.1 EARTH系统第20-22页
 §2.2 SMT结构第22-24页
 §2.3 MultiScalar结构第24-25页
 §2.4 SPSM结构第25-26页
 §2.5 其他技术第26-33页
  2.5.1 前瞻执行技术第26-28页
  2.5.2 数据前瞻技术第28-29页
  2.5.3 单芯片多处理器SCMP第29-31页
  2.5.4 Trace Cache与Trace处理器第31-33页
 §2.6 小结第33-35页
第3章 前瞻多线程结构第35-45页
 §3.1 SMA体系结构概述第35-36页
 §3.2 线程、掩码与指令扩展第36-38页
 §3.3 SMA运行机制第38-39页
 §3.4 SMA执行实例第39-44页
  3.4.1 DO ALL循环第40-41页
  3.4.2 DO Across循环第41-43页
  3.4.3 函数调用第43-44页
 §3.5 小结第44-45页
第4章 基本编译优化框架的构造第45-56页
 §4.1 编译器与体系结构的接口第45-46页
 §4.2 SMA结构的性能要素第46-51页
  4.2.1 单线程执行周期分析第46-47页
  4.2.2 多线程执行周期分析第47-51页
  4.2.3 关键性能要素第51页
 §4.3 基于反馈的持续编译优化技术第51-53页
 §4.4 SMA编译优化框架结构第53-55页
 §4.5 小结第55-56页
第5章 前瞻编译优化技术第56-76页
 §5.1 基本编译方案第56-59页
  5.1.1 基于基本块的线程划分算法第56-57页
  5.1.2 线程掩码生成算法第57-58页
  5.1.3 方案评估第58-59页
 §5.2 线程划分优化第59-65页
  5.2.1 循环优化第59-60页
  5.2.2 控制相关优化第60-62页
  5.2.3 数据相关优化第62-65页
 §5.3 线程体积优化第65-66页
 §5.4 线程前瞻执行优化第66-69页
  5.4.1 循环转换第66-68页
  5.4.2 多路径前瞻执行优化第68-69页
 §5.5 性能模拟结果与评估第69-74页
  5.5.1 基准测试代码与模拟环境第69-70页
  5.5.2 性能评价标准第70-71页
  5.5.3 模拟结果与分析(1)第71-73页
  5.5.4 模拟结果与分析(2)第73-74页
 §5.6 小结第74-76页
第6章 访存编译优化技术第76-96页
 §6.1 多线程对访存的影响第76-77页
 §6.2 SMA中的动态数据前瞻第77-79页
 §6.3 SMA取指与i-Cache设计第79-82页
  6.3.1 取值策略第79-80页
  6.3.2 带宽分析第80-81页
  6.3.3 指令Cache设计第81-82页
 §6.4 静态访存优化规则第82-85页
 §6.5 预取机制的设计与实现第85-91页
  6.5.1 预取性能模型第85-87页
  6.5.2 SMA预取优化规则第87-89页
  6.5.3 Cache Filter的设计与实现第89-91页
 §6.6 性能模拟与结果分析第91-95页
  6.6.1 模拟环境与评价标准第91-92页
  6.6.2 模拟结果与分析第92-95页
 §6.7 小结第95-96页
第7章 模拟平台实现与评估第96-102页
 §7.1 总体结构第96-98页
 §7.2 Profile采集与处理第98-99页
 §7.3 代码装载第99-100页
 §7.4 模拟平台评估第100-102页
第8章 结束语第102-105页
 §8.1 所作的工作与创新第102-103页
 §8.2 未来研究方向第103-105页
攻读博士学位期间发表的论文第105-106页
致谢第106-108页
参考文献第108-114页
附录A SMA-DLXSIM使用手册第114-118页
 (1) SMA-DLXSIM的使用第114-115页
 (2) SMA-DLX汇编程序第115-117页
 (3) 示例第117-118页
附录B SMA-DLXSIM程序清单第118页

论文共118页,点击 下载论文
上一篇:自由曲面的造型及数控加工
下一篇:用有限维约化和反可积方法对若干无穷维问题的研究