首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

多核结构上高效的线程级推测及事务执行模型研究

摘要第1-7页
ABSTRACT第7-18页
第1章 绪论第18-36页
   ·研究背景第18-27页
     ·多核结构出现的必然性第18-21页
     ·如何利用多核加速单个串行应用第21-22页
     ·手工线程化面临的困难第22-25页
     ·自动线程化面临的困难第25-27页
   ·基于事务存储的推测多线程方法第27-33页
     ·推测多线程方法的基本思想及其优势第27-28页
     ·线程的划分第28-30页
     ·线程的推测执行第30-31页
     ·基于事务存储实现高效的推测多线程同步机制第31-33页
   ·论文研究目标和主要工作第33-35页
   ·论文的结构第35-36页
第2章 相关研究工作第36-53页
   ·Hydra CMP第36-40页
     ·推测硬件结构扩展第37-38页
     ·推测线程产生机制第38-39页
     ·运行时冲突检测机制第39页
     ·不足之处第39-40页
   ·STAMPede第40-45页
     ·推测状态位扩展第40-41页
     ·推测一致性协议第41-44页
     ·不足之处和后续改进第44-45页
   ·事务存储第45-49页
     ·HTM方案第45-46页
     ·TLR/SLE方案第46-47页
     ·UTM方案第47页
     ·VTM方案第47-49页
     ·STM方案第49页
   ·TCC(Transactional Memory Coherency and Consistency)第49-51页
     ·TCC的线程推测机制第49-51页
   ·小结第51-53页
第3章 SPoTM:一种基于事务存储的推测多线程体系结构第53-69页
   ·设计思想第53-54页
   ·结构模型第54-58页
     ·一级数据Cache第54-55页
     ·推测控制器第55-56页
     ·总线第56页
     ·二级Cache和存储管理第56-57页
     ·执行核第57-58页
   ·线程执行模型第58-62页
     ·推测初始化第59页
     ·推测线程启动第59页
     ·推测访存操作的跟踪和记录第59-60页
     ·提交过程第60-61页
     ·冲突检测和错误恢复第61-62页
     ·循环结束第62页
   ·编程模型第62-67页
     ·推测封装函数第63-64页
     ·变量声明调整第64-65页
     ·推测库函数第65-66页
     ·编译器支持第66-67页
     ·补充和评价第67页
   ·小结第67-69页
第4章 SPoTM模拟环境的设计与实现第69-86页
   ·SPoTM功能级验证工具设计第70-74页
     ·实现环境Pin第71-72页
     ·fastTM主要功能第72页
     ·fastTM的设计方法第72-74页
   ·Sim-SPoTM模拟器设计第74-85页
     ·核级设计第76-83页
     ·系统级设计第83-85页
   ·小结第85-86页
第5章 SPoTM模型的量化分析与方案优化第86-107页
   ·实验方案第86-88页
     ·测试程序集第86-87页
     ·模拟器配置第87-88页
   ·基本评测结果第88-95页
     ·核级性能结果第90-91页
     ·系统级性能结果第91-95页
   ·运行时推测机制调整对性能的影响第95-100页
     ·结构模型设计选择第95-97页
     ·执行模型调整第97-99页
     ·放松串行语义后的推测执行第99-100页
   ·推测多线程与Cache局部性第100-106页
     ·Cache局部性分析第100-102页
     ·通过推测广播预取来改善一级数据Cache局部性第102-103页
     ·二级Cache上推测失败线程的预取效果第103-106页
   ·小结第106-107页
第6章 在线剖析指导的推测多线程动态优化第107-134页
   ·在线剖析的使用动机第107-109页
   ·相关工作第109-116页
     ·剖析技术简介第109-111页
     ·Mitosis编译工具第111-113页
     ·SPT方案第113-115页
     ·JRPM运行时系统第115-116页
   ·连续两阶段剖析指导的推测多线程动态优化方法第116-121页
   ·实现难点第121-128页
     ·初始剖析的精度及其快速实现第121-124页
     ·预先优化技术第124-128页
   ·动态优化框架的扩展和限制第128-130页
     ·优化框架的扩展第128-130页
     ·优化框架局限性分析第130页
   ·实验和结果第130-133页
   ·小结第133-134页
第7章 全文总结第134-138页
   ·研究工作和成果第134-136页
   ·本文的主要创新第136页
   ·进一步的工作第136-138页
参考文献第138-145页
在读期间发表的学术论文与取得的研究成果第145-146页
在读期间参与的科研项目第146-147页
致谢第147-148页

论文共148页,点击 下载论文
上一篇:光分组交换网络性能研究--交换矩阵及网络串扰与时延性能评价
下一篇:论利益平衡—转型时期中国的利益冲突及其法律规制