摘要 | 第1-6页 |
Abstract | 第6-11页 |
图目录 | 第11-12页 |
表目录 | 第12-13页 |
第1章 绪 论 | 第13-29页 |
·研究背景 | 第13-20页 |
·处理器发展的多核化趋势 | 第13-15页 |
·片上多处理器带来的机遇与挑战 | 第15-17页 |
·传统并行编程技术的局限性 | 第17-20页 |
·多核处理器并行编程的新技术 | 第20-27页 |
·事务存储技术 | 第20-23页 |
·线程级推测技术 | 第23-26页 |
·事务存储与线程级推测技术的结合 | 第26-27页 |
·研究目标与主要工作 | 第27-28页 |
·论文组织结构 | 第28-29页 |
第2章 相关研究工作 | 第29-41页 |
·TCC & Bulk | 第29-32页 |
·TCC 编程模型 | 第29-30页 |
·TCC 体系结构 | 第30-31页 |
·Bulk 模型 | 第31-32页 |
·LogTM & LogTM-SE | 第32-35页 |
·早期的大事务支持方案 | 第32页 |
·LogTM 的推测状态管理 | 第32-33页 |
·LogTM 的冲突检测与解决机制 | 第33-35页 |
·LogTM-SE 的改进 | 第35页 |
·STAMPede | 第35-39页 |
·推测状态位扩展 | 第36页 |
·推测一致性协议 | 第36-39页 |
·问题与改进 | 第39页 |
·小结 | 第39-41页 |
第3章 LogSPoTM 系统设计与软件模拟实现 | 第41-59页 |
·LogSPoTM 系统 | 第41-50页 |
·抽象硬件结构模型 | 第41-43页 |
·SPoTM 线程划分与执行模型 | 第43-45页 |
·编程模型 | 第45-46页 |
·推测并行化代码变换步骤 | 第46-50页 |
·LogSPoTM 模拟实现 | 第50-55页 |
·模拟器实现 | 第50-54页 |
·运行时支撑环境 | 第54-55页 |
·关于设计实现的讨论 | 第55-58页 |
·激进的版本管理的影响 | 第55-56页 |
·硬件线程间数据通信支持问题 | 第56-57页 |
·伪依赖问题 | 第57-58页 |
·小结 | 第58-59页 |
第4章 LogSPoTM 系统的量化分析与方案优化 | 第59-77页 |
·实验方案 | 第59-62页 |
·测试程序选择 | 第59-61页 |
·实验配置 | 第61-62页 |
·基本性能分析 | 第62-70页 |
·加速比与可扩放性 | 第62-65页 |
·迭代启动策略 | 第65-66页 |
·回退率分析 | 第66页 |
·推测并行对Cache 行为的影响 | 第66-70页 |
·性能影响分析 | 第70-74页 |
·Cache 组织 | 第70-72页 |
·仲裁 | 第72-73页 |
·伪依赖问题 | 第73-74页 |
·维持串行语义的开销 | 第74页 |
·小结 | 第74-77页 |
第5章 LogSPoTM 硬件模拟环境设计 | 第77-87页 |
·软件模拟的问题与硬件模拟 | 第77-78页 |
·现有的硬件模拟验证方案 | 第78页 |
·HAsim 硬件模拟框架 | 第78-84页 |
·LogSPoTM 到HAsim 的映射 | 第82-83页 |
·与处理器松散耦合的设计 | 第83-84页 |
·LogSPoTM 硬件模拟环境组件设计 | 第84-86页 |
·事务管理器 | 第84-85页 |
·缓存状态表与读写集合 | 第85-86页 |
·缓存控制器与一致性引擎 | 第86页 |
·小结 | 第86-87页 |
第6章 全文总结 | 第87-91页 |
·研究成果与创新 | 第87-89页 |
·进一步的工作 | 第89-91页 |
参考文献 | 第91-97页 |
致谢 | 第97-98页 |
在读期间发表的学术论文 | 第98-99页 |
在读期间参与的科研项目 | 第99页 |