摘要 | 第1-5页 |
ABSTRACT | 第5-15页 |
第1章 绪论 | 第15-20页 |
·研究背景 | 第15-18页 |
·片上线延迟对提高指令级并行性的影响 | 第16页 |
·分片式处理器体系结构的提出 | 第16-17页 |
·非均匀一致高速缓存的提出 | 第17-18页 |
·TPA 与NUCA 结合的研究意义 | 第18页 |
·论文主要工作 | 第18-19页 |
·论文结构 | 第19-20页 |
第2章 相关工作 | 第20-35页 |
·分片式处理器体系结构 | 第20-22页 |
·数据依赖显式编码的指令集 | 第20页 |
·静态放置动态发射方式 | 第20-21页 |
·以超级块为原子的执行模型 | 第21-22页 |
·分片式处理器微体系结构 | 第22-28页 |
·分布式的控制协议 | 第23-24页 |
·分布式的一级Cache | 第24-28页 |
·分布式的Load / Store 队列 | 第25-26页 |
·分布式的访存依赖预测器 | 第26-28页 |
·非均匀一致CACHE 结构 | 第28-31页 |
·静态NUCA 结构 | 第29页 |
·动态NUCA 结构 | 第29-31页 |
·Bank Set 方案 | 第30页 |
·NuRapid 方案 | 第30-31页 |
·非均匀一致CACHE 结构的应用 | 第31-33页 |
·片上多处理器的二级Cache 结构 | 第31-33页 |
·共享度方案 | 第32-33页 |
·CMP-NuRapid 方案 | 第33页 |
·分片式的一级Cache 结构 | 第33页 |
·小结 | 第33-35页 |
第3章 非均匀一致二级缓存的设计 | 第35-54页 |
·总体结构 | 第35-36页 |
·静态数据映射方式 | 第36-37页 |
·片上网络互连 | 第37-43页 |
·路由器设计 | 第38-40页 |
·虚通道 | 第38-39页 |
·路由交换 | 第39-40页 |
·流控 | 第40页 |
·竞争仲裁机制 | 第40页 |
·网络地址转换 | 第40-42页 |
·报文格式设计 | 第42-43页 |
·CACHE BANK 内部结构 | 第43-46页 |
·Cache Bank 与Router 的接口 | 第44页 |
·Tag Array 和Data Array | 第44-45页 |
·MSHR 设计 | 第45-46页 |
·CACHE 事务的处理 | 第46-50页 |
·处理器读请求 | 第48页 |
·处理器写请求 | 第48-50页 |
·CACHE 部件的流水化设计 | 第50-53页 |
·小结 | 第53-54页 |
第4章 非均匀一致一级缓存中LOAD 本地化执行模型 | 第54-70页 |
·基本思想及动机 | 第54-56页 |
·CACHE 块拷贝策略 | 第56-61页 |
·块拷贝预测器 | 第57-59页 |
·提高拷贝块的有效性 | 第59-61页 |
·可变的计数步长 | 第59-60页 |
·通过反馈修正拷贝阈值 | 第60页 |
·Store 对表项的复位 | 第60-61页 |
·拷贝块的映射方式 | 第61-62页 |
·对Tag Array 结构的修改 | 第61页 |
·拷贝块的定位 | 第61-62页 |
·拷贝块的一致性维护 | 第62-64页 |
·写更新策略 | 第63页 |
·写失效策略 | 第63页 |
·选择性的写失效策略 | 第63-64页 |
·执行端的访存依赖预测 | 第64-66页 |
·在客Tile 上唤醒推迟的Load | 第64-65页 |
·在主Tile 上唤醒推迟的Load | 第65-66页 |
·维持访存的正确顺序 | 第66-68页 |
·Store 值传播 | 第66-67页 |
·Load 违例检测 | 第67页 |
·Store 按序提交 | 第67-68页 |
·拷贝块的丢弃 | 第68-69页 |
·拷贝块被替换 | 第68页 |
·原始块被替换 | 第68-69页 |
·非强制的拷贝块失效 | 第69页 |
·小结 | 第69-70页 |
第5章 LOAD 本地化执行模型的模拟及性能评测 | 第70-88页 |
·模拟环境 | 第70-72页 |
·Trace 驱动的一级Cache 功能模拟 | 第70-71页 |
·T-Flex 时钟精确模拟器的配置 | 第71页 |
·基准测试程序描述 | 第71-72页 |
·基本模型评测 | 第72-79页 |
·基本模型参数 | 第72页 |
·性能提升分析 | 第72-74页 |
·开销分析 | 第74-78页 |
·结构开销 | 第74-75页 |
·Cache 容量开销 | 第75页 |
·通信开销 | 第75-77页 |
·关键路径开销 | 第77-78页 |
·对依赖预测器准确性的影响 | 第78-79页 |
·不同策略选择 | 第79-87页 |
·拷贝阈值选择 | 第79-81页 |
·拷贝预测表容量选择 | 第81-82页 |
·拷贝策略的扩展方案 | 第82-84页 |
·可变的计数步长 | 第82-83页 |
·通过反馈修正拷贝阈值 | 第83页 |
·Store 对表项的复位 | 第83-84页 |
·一致性维护策略 | 第84-86页 |
·对推迟执行的Load 指令的处理策略 | 第86-87页 |
·小结 | 第87-88页 |
第6章 全文总结 | 第88-90页 |
·研究工作与成果 | 第88-89页 |
·未来工作 | 第89-90页 |
参考文献 | 第90-93页 |
致谢 | 第93-94页 |
在读期间发表的学术论文与取得的研究成果 | 第94-95页 |
在读期间参与的科研项目 | 第95页 |