中文摘要 | 第1-11页 |
英文摘要 | 第11-13页 |
第1章 绪论 | 第13-20页 |
§1.1 研究背景 | 第13-16页 |
1.1.1 超标量结构的概况与局限 | 第13-14页 |
1.1.2 ILP的潜力和限制 | 第14-16页 |
§1.2 多线程结构与线程级并行 | 第16-17页 |
§1.3 延迟隐藏技术 | 第17-18页 |
§1.4 本文的工作 | 第18-19页 |
§1.5 本文的结构 | 第19-20页 |
第2章 相关研究现状 | 第20-35页 |
§2.1 EARTH系统 | 第20-22页 |
§2.2 SMT结构 | 第22-24页 |
§2.3 MultiScalar结构 | 第24-25页 |
§2.4 SPSM结构 | 第25-26页 |
§2.5 其他技术 | 第26-33页 |
2.5.1 前瞻执行技术 | 第26-28页 |
2.5.2 数据前瞻技术 | 第28-29页 |
2.5.3 单芯片多处理器SCMP | 第29-31页 |
2.5.4 Trace Cache与Trace处理器 | 第31-33页 |
§2.6 小结 | 第33-35页 |
第3章 前瞻多线程结构 | 第35-45页 |
§3.1 SMA体系结构概述 | 第35-36页 |
§3.2 线程、掩码与指令扩展 | 第36-38页 |
§3.3 SMA运行机制 | 第38-39页 |
§3.4 SMA执行实例 | 第39-44页 |
3.4.1 DO ALL循环 | 第40-41页 |
3.4.2 DO Across循环 | 第41-43页 |
3.4.3 函数调用 | 第43-44页 |
§3.5 小结 | 第44-45页 |
第4章 基本编译优化框架的构造 | 第45-56页 |
§4.1 编译器与体系结构的接口 | 第45-46页 |
§4.2 SMA结构的性能要素 | 第46-51页 |
4.2.1 单线程执行周期分析 | 第46-47页 |
4.2.2 多线程执行周期分析 | 第47-51页 |
4.2.3 关键性能要素 | 第51页 |
§4.3 基于反馈的持续编译优化技术 | 第51-53页 |
§4.4 SMA编译优化框架结构 | 第53-55页 |
§4.5 小结 | 第55-56页 |
第5章 前瞻编译优化技术 | 第56-76页 |
§5.1 基本编译方案 | 第56-59页 |
5.1.1 基于基本块的线程划分算法 | 第56-57页 |
5.1.2 线程掩码生成算法 | 第57-58页 |
5.1.3 方案评估 | 第58-59页 |
§5.2 线程划分优化 | 第59-65页 |
5.2.1 循环优化 | 第59-60页 |
5.2.2 控制相关优化 | 第60-62页 |
5.2.3 数据相关优化 | 第62-65页 |
§5.3 线程体积优化 | 第65-66页 |
§5.4 线程前瞻执行优化 | 第66-69页 |
5.4.1 循环转换 | 第66-68页 |
5.4.2 多路径前瞻执行优化 | 第68-69页 |
§5.5 性能模拟结果与评估 | 第69-74页 |
5.5.1 基准测试代码与模拟环境 | 第69-70页 |
5.5.2 性能评价标准 | 第70-71页 |
5.5.3 模拟结果与分析(1) | 第71-73页 |
5.5.4 模拟结果与分析(2) | 第73-74页 |
§5.6 小结 | 第74-76页 |
第6章 访存编译优化技术 | 第76-96页 |
§6.1 多线程对访存的影响 | 第76-77页 |
§6.2 SMA中的动态数据前瞻 | 第77-79页 |
§6.3 SMA取指与i-Cache设计 | 第79-82页 |
6.3.1 取值策略 | 第79-80页 |
6.3.2 带宽分析 | 第80-81页 |
6.3.3 指令Cache设计 | 第81-82页 |
§6.4 静态访存优化规则 | 第82-85页 |
§6.5 预取机制的设计与实现 | 第85-91页 |
6.5.1 预取性能模型 | 第85-87页 |
6.5.2 SMA预取优化规则 | 第87-89页 |
6.5.3 Cache Filter的设计与实现 | 第89-91页 |
§6.6 性能模拟与结果分析 | 第91-95页 |
6.6.1 模拟环境与评价标准 | 第91-92页 |
6.6.2 模拟结果与分析 | 第92-95页 |
§6.7 小结 | 第95-96页 |
第7章 模拟平台实现与评估 | 第96-102页 |
§7.1 总体结构 | 第96-98页 |
§7.2 Profile采集与处理 | 第98-99页 |
§7.3 代码装载 | 第99-100页 |
§7.4 模拟平台评估 | 第100-102页 |
第8章 结束语 | 第102-105页 |
§8.1 所作的工作与创新 | 第102-103页 |
§8.2 未来研究方向 | 第103-105页 |
攻读博士学位期间发表的论文 | 第105-106页 |
致谢 | 第106-108页 |
参考文献 | 第108-114页 |
附录A SMA-DLXSIM使用手册 | 第114-118页 |
(1) SMA-DLXSIM的使用 | 第114-115页 |
(2) SMA-DLX汇编程序 | 第115-117页 |
(3) 示例 | 第117-118页 |
附录B SMA-DLXSIM程序清单 | 第118页 |