| 摘要 | 第1-6页 |
| Abstract | 第6-16页 |
| 第1章 绪论 | 第16-44页 |
| ·课题研究背景 | 第16-21页 |
| ·ILP 和超标量处理器 | 第21-23页 |
| ·分簇超标量处理器 | 第23-29页 |
| ·分簇超标量处理器的典型结构 | 第23-24页 |
| ·分簇超标量处理器的寄存器组织策略 | 第24-26页 |
| ·分簇超标量处理器的好处 | 第26-27页 |
| ·分簇超标量处理器的性能开销 | 第27-29页 |
| ·相关工作 | 第29-38页 |
| ·分派算法 | 第29-31页 |
| ·性能与瓶颈分析方面 | 第31-33页 |
| ·微结构方面 | 第33-36页 |
| ·标量网络的研究 | 第36-38页 |
| ·分簇处理器中存储器系统 | 第38页 |
| ·研究分簇超标量处理器的意义 | 第38-39页 |
| ·研究内容和论文组织结构 | 第39-40页 |
| ·本文采用的仿真环境 | 第40-44页 |
| ·处理器基本模型 | 第40页 |
| ·模拟器及其参数选择 | 第40-43页 |
| ·Benchmark 及仿真加速策略 | 第43-44页 |
| 第2章 分派算法 | 第44-64页 |
| ·引言 | 第44-45页 |
| ·问题的提出 | 第45-51页 |
| ·分派算法的描述的问题 | 第45-48页 |
| ·仿真参数设置导致的问题 | 第48-51页 |
| ·分派算法的比较 | 第51-59页 |
| ·分簇粒度对分派算法性能的影响 | 第52页 |
| ·通信延迟对分派算法性能的影响 | 第52-53页 |
| ·指令队列大小对分派算法性能的影响 | 第53-55页 |
| ·指令队列分派端口对分派算法性能的影响 | 第55-57页 |
| ·失败策略对分派算法性能的影响 | 第57-59页 |
| ·LA 分派算法 | 第59-63页 |
| ·LA 分派算法的基本原理 | 第59-61页 |
| ·LA 分派算法的性能 | 第61-63页 |
| ·本章小结 | 第63-64页 |
| 第3章 关键路径分析 | 第64-86页 |
| ·关键路径分析框架 | 第64-74页 |
| ·关键路径分析概述 | 第64-65页 |
| ·关键路径分析框架的基本结构 | 第65-68页 |
| ·在线关键路径分析方法 | 第68-72页 |
| ·关键路径分析框架的验证 | 第72-74页 |
| ·关键路径分析框架的应用 | 第74-85页 |
| ·分簇超标量处理器关键路径的 CPI 分析 | 第74-78页 |
| ·功能单元数目对分簇超标量性能影响的分析 | 第78-79页 |
| ·指令在指令队列中位置与簇间通信和发射冲突的关系 | 第79-82页 |
| ·指令的关键性的研究 | 第82-85页 |
| ·本章小结 | 第85-86页 |
| 第4章 一种分簇超标量处理器的微结构 | 第86-119页 |
| ·引言 | 第86-87页 |
| ·微结构概述 | 第87-95页 |
| ·取指和译码 | 第88页 |
| ·指令的分派 | 第88-90页 |
| ·分布式重命名 | 第90页 |
| ·拷贝指令 | 第90-92页 |
| ·指令的调度与执行 | 第92-94页 |
| ·点对点标量网络 | 第94页 |
| ·分布式递交 | 第94-95页 |
| ·分布式重命名技术 | 第95-103页 |
| ·分布式重命名技术概述 | 第95-97页 |
| ·指令分派流水段的重命名 | 第97-101页 |
| ·簇中的重命名 | 第101-102页 |
| ·分簇对寄存器回收的影响 | 第102-103页 |
| ·带拷贝附加项的指令队列设计 | 第103-118页 |
| ·拷贝指令对指令队列的资源需求 | 第104-106页 |
| ·现有指令队列的局限性 | 第106-109页 |
| ·附加拷贝信息的指令队列结构 | 第109-114页 |
| ·设计参数选择及性能评估 | 第114-118页 |
| ·本章小结 | 第118-119页 |
| 第5章 分簇超标量中点对点标量网络 | 第119-148页 |
| ·引言 | 第119-121页 |
| ·通信特征提取和分析 | 第121-128页 |
| ·通信特征参数 | 第121-122页 |
| ·通信特征的提取与分析 | 第122-128页 |
| ·标量网络仿真与性能分析 | 第128-135页 |
| ·标量网络性能评估平台结构 | 第129-130页 |
| ·标量网络性能评估与分析 | 第130-135页 |
| ·标量网络设计与分析 | 第135-142页 |
| ·引入拷贝指令所带来的问题 | 第135-136页 |
| ·标量网络总体结构设计 | 第136-141页 |
| ·路由器与处理器的耦合 | 第141-142页 |
| ·仿真结果与性能分析 | 第142-147页 |
| ·处理器性能分析 | 第142-145页 |
| ·敏感性分析 | 第145-147页 |
| ·本章小结 | 第147-148页 |
| 第6章 分簇投机的 L0 Cache 设计 | 第148-162页 |
| ·引言 | 第148页 |
| ·分簇投机 L0 Cache 的总体设计方案 | 第148-152页 |
| ·分簇投机 L0 Cache 的组织结构 | 第148-150页 |
| ·分簇投机 L0 Cache 的工作原理 | 第150-151页 |
| ·分簇投机 L0 Cache 投机错误分析及改进 | 第151-152页 |
| ·分簇投机 L0 Cache 仿真结果与分析 | 第152-155页 |
| ·具有读更新策略的分簇投机 L0 Cache 设计方案 | 第155-158页 |
| ·具有读更新策略的分簇投机 L0 Cache 的仿真结果与分析 | 第156-157页 |
| ·使用定长读取改进分簇投机 L0 Cache 投机预测率 | 第157-158页 |
| ·采用分簇投机 L0 Cache 结构的处理器性能评价 | 第158-160页 |
| ·L0 Cache 与 NoSQ 的结合 | 第160-161页 |
| ·本章小结 | 第161-162页 |
| 结论 | 第162-164页 |
| 参考文献 | 第164-175页 |
| 攻读学位期间发表的学术论文 | 第175-177页 |
| 致谢 | 第177-178页 |
| 个人简历 | 第178页 |