摘要 | 第1-7页 |
ABSTRACT | 第7-18页 |
第1章 绪论 | 第18-36页 |
·研究背景 | 第18-27页 |
·多核结构出现的必然性 | 第18-21页 |
·如何利用多核加速单个串行应用 | 第21-22页 |
·手工线程化面临的困难 | 第22-25页 |
·自动线程化面临的困难 | 第25-27页 |
·基于事务存储的推测多线程方法 | 第27-33页 |
·推测多线程方法的基本思想及其优势 | 第27-28页 |
·线程的划分 | 第28-30页 |
·线程的推测执行 | 第30-31页 |
·基于事务存储实现高效的推测多线程同步机制 | 第31-33页 |
·论文研究目标和主要工作 | 第33-35页 |
·论文的结构 | 第35-36页 |
第2章 相关研究工作 | 第36-53页 |
·Hydra CMP | 第36-40页 |
·推测硬件结构扩展 | 第37-38页 |
·推测线程产生机制 | 第38-39页 |
·运行时冲突检测机制 | 第39页 |
·不足之处 | 第39-40页 |
·STAMPede | 第40-45页 |
·推测状态位扩展 | 第40-41页 |
·推测一致性协议 | 第41-44页 |
·不足之处和后续改进 | 第44-45页 |
·事务存储 | 第45-49页 |
·HTM方案 | 第45-46页 |
·TLR/SLE方案 | 第46-47页 |
·UTM方案 | 第47页 |
·VTM方案 | 第47-49页 |
·STM方案 | 第49页 |
·TCC(Transactional Memory Coherency and Consistency) | 第49-51页 |
·TCC的线程推测机制 | 第49-51页 |
·小结 | 第51-53页 |
第3章 SPoTM:一种基于事务存储的推测多线程体系结构 | 第53-69页 |
·设计思想 | 第53-54页 |
·结构模型 | 第54-58页 |
·一级数据Cache | 第54-55页 |
·推测控制器 | 第55-56页 |
·总线 | 第56页 |
·二级Cache和存储管理 | 第56-57页 |
·执行核 | 第57-58页 |
·线程执行模型 | 第58-62页 |
·推测初始化 | 第59页 |
·推测线程启动 | 第59页 |
·推测访存操作的跟踪和记录 | 第59-60页 |
·提交过程 | 第60-61页 |
·冲突检测和错误恢复 | 第61-62页 |
·循环结束 | 第62页 |
·编程模型 | 第62-67页 |
·推测封装函数 | 第63-64页 |
·变量声明调整 | 第64-65页 |
·推测库函数 | 第65-66页 |
·编译器支持 | 第66-67页 |
·补充和评价 | 第67页 |
·小结 | 第67-69页 |
第4章 SPoTM模拟环境的设计与实现 | 第69-86页 |
·SPoTM功能级验证工具设计 | 第70-74页 |
·实现环境Pin | 第71-72页 |
·fastTM主要功能 | 第72页 |
·fastTM的设计方法 | 第72-74页 |
·Sim-SPoTM模拟器设计 | 第74-85页 |
·核级设计 | 第76-83页 |
·系统级设计 | 第83-85页 |
·小结 | 第85-86页 |
第5章 SPoTM模型的量化分析与方案优化 | 第86-107页 |
·实验方案 | 第86-88页 |
·测试程序集 | 第86-87页 |
·模拟器配置 | 第87-88页 |
·基本评测结果 | 第88-95页 |
·核级性能结果 | 第90-91页 |
·系统级性能结果 | 第91-95页 |
·运行时推测机制调整对性能的影响 | 第95-100页 |
·结构模型设计选择 | 第95-97页 |
·执行模型调整 | 第97-99页 |
·放松串行语义后的推测执行 | 第99-100页 |
·推测多线程与Cache局部性 | 第100-106页 |
·Cache局部性分析 | 第100-102页 |
·通过推测广播预取来改善一级数据Cache局部性 | 第102-103页 |
·二级Cache上推测失败线程的预取效果 | 第103-106页 |
·小结 | 第106-107页 |
第6章 在线剖析指导的推测多线程动态优化 | 第107-134页 |
·在线剖析的使用动机 | 第107-109页 |
·相关工作 | 第109-116页 |
·剖析技术简介 | 第109-111页 |
·Mitosis编译工具 | 第111-113页 |
·SPT方案 | 第113-115页 |
·JRPM运行时系统 | 第115-116页 |
·连续两阶段剖析指导的推测多线程动态优化方法 | 第116-121页 |
·实现难点 | 第121-128页 |
·初始剖析的精度及其快速实现 | 第121-124页 |
·预先优化技术 | 第124-128页 |
·动态优化框架的扩展和限制 | 第128-130页 |
·优化框架的扩展 | 第128-130页 |
·优化框架局限性分析 | 第130页 |
·实验和结果 | 第130-133页 |
·小结 | 第133-134页 |
第7章 全文总结 | 第134-138页 |
·研究工作和成果 | 第134-136页 |
·本文的主要创新 | 第136页 |
·进一步的工作 | 第136-138页 |
参考文献 | 第138-145页 |
在读期间发表的学术论文与取得的研究成果 | 第145-146页 |
在读期间参与的科研项目 | 第146-147页 |
致谢 | 第147-148页 |