首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

分片式处理器上非均匀一致缓存的设计与优化

摘要第1-5页
ABSTRACT第5-15页
第1章 绪论第15-20页
   ·研究背景第15-18页
     ·片上线延迟对提高指令级并行性的影响第16页
     ·分片式处理器体系结构的提出第16-17页
     ·非均匀一致高速缓存的提出第17-18页
   ·TPA 与NUCA 结合的研究意义第18页
   ·论文主要工作第18-19页
   ·论文结构第19-20页
第2章 相关工作第20-35页
   ·分片式处理器体系结构第20-22页
     ·数据依赖显式编码的指令集第20页
     ·静态放置动态发射方式第20-21页
     ·以超级块为原子的执行模型第21-22页
   ·分片式处理器微体系结构第22-28页
     ·分布式的控制协议第23-24页
     ·分布式的一级Cache第24-28页
       ·分布式的Load / Store 队列第25-26页
       ·分布式的访存依赖预测器第26-28页
   ·非均匀一致CACHE 结构第28-31页
     ·静态NUCA 结构第29页
     ·动态NUCA 结构第29-31页
       ·Bank Set 方案第30页
       ·NuRapid 方案第30-31页
   ·非均匀一致CACHE 结构的应用第31-33页
     ·片上多处理器的二级Cache 结构第31-33页
       ·共享度方案第32-33页
       ·CMP-NuRapid 方案第33页
     ·分片式的一级Cache 结构第33页
   ·小结第33-35页
第3章 非均匀一致二级缓存的设计第35-54页
   ·总体结构第35-36页
   ·静态数据映射方式第36-37页
   ·片上网络互连第37-43页
     ·路由器设计第38-40页
       ·虚通道第38-39页
       ·路由交换第39-40页
       ·流控第40页
       ·竞争仲裁机制第40页
     ·网络地址转换第40-42页
     ·报文格式设计第42-43页
   ·CACHE BANK 内部结构第43-46页
     ·Cache Bank 与Router 的接口第44页
     ·Tag Array 和Data Array第44-45页
     ·MSHR 设计第45-46页
   ·CACHE 事务的处理第46-50页
     ·处理器读请求第48页
     ·处理器写请求第48-50页
   ·CACHE 部件的流水化设计第50-53页
   ·小结第53-54页
第4章 非均匀一致一级缓存中LOAD 本地化执行模型第54-70页
   ·基本思想及动机第54-56页
   ·CACHE 块拷贝策略第56-61页
     ·块拷贝预测器第57-59页
     ·提高拷贝块的有效性第59-61页
       ·可变的计数步长第59-60页
       ·通过反馈修正拷贝阈值第60页
       ·Store 对表项的复位第60-61页
   ·拷贝块的映射方式第61-62页
     ·对Tag Array 结构的修改第61页
     ·拷贝块的定位第61-62页
   ·拷贝块的一致性维护第62-64页
     ·写更新策略第63页
     ·写失效策略第63页
     ·选择性的写失效策略第63-64页
   ·执行端的访存依赖预测第64-66页
     ·在客Tile 上唤醒推迟的Load第64-65页
     ·在主Tile 上唤醒推迟的Load第65-66页
   ·维持访存的正确顺序第66-68页
     ·Store 值传播第66-67页
     ·Load 违例检测第67页
     ·Store 按序提交第67-68页
   ·拷贝块的丢弃第68-69页
     ·拷贝块被替换第68页
     ·原始块被替换第68-69页
     ·非强制的拷贝块失效第69页
   ·小结第69-70页
第5章 LOAD 本地化执行模型的模拟及性能评测第70-88页
   ·模拟环境第70-72页
     ·Trace 驱动的一级Cache 功能模拟第70-71页
     ·T-Flex 时钟精确模拟器的配置第71页
     ·基准测试程序描述第71-72页
   ·基本模型评测第72-79页
     ·基本模型参数第72页
     ·性能提升分析第72-74页
     ·开销分析第74-78页
       ·结构开销第74-75页
       ·Cache 容量开销第75页
       ·通信开销第75-77页
       ·关键路径开销第77-78页
     ·对依赖预测器准确性的影响第78-79页
   ·不同策略选择第79-87页
     ·拷贝阈值选择第79-81页
     ·拷贝预测表容量选择第81-82页
     ·拷贝策略的扩展方案第82-84页
       ·可变的计数步长第82-83页
       ·通过反馈修正拷贝阈值第83页
       ·Store 对表项的复位第83-84页
     ·一致性维护策略第84-86页
     ·对推迟执行的Load 指令的处理策略第86-87页
   ·小结第87-88页
第6章 全文总结第88-90页
   ·研究工作与成果第88-89页
   ·未来工作第89-90页
参考文献第90-93页
致谢第93-94页
在读期间发表的学术论文与取得的研究成果第94-95页
在读期间参与的科研项目第95页

论文共95页,点击 下载论文
上一篇:计算机显示器火灾特性的实验研究
下一篇:ATLAS在龙芯2F上的访存优化