面向多核/众核体系结构的确定性并行关键技术研究
摘要 | 第10-12页 |
Abstract | 第12-14页 |
第一章 绪论 | 第15-26页 |
1.1 研究背景 | 第16-21页 |
1.1.1 多核/众核的并行发展趋势 | 第16-17页 |
1.1.2 并行的不确定性问题 | 第17-20页 |
1.1.3 确定性并行技术 | 第20-21页 |
1.2 研究内容及贡献 | 第21-24页 |
1.3 文章结构 | 第24-26页 |
第二章 相关研究 | 第26-38页 |
2.1 确定性运行时技术 | 第26-31页 |
2.1.1 DMP系统 | 第26-27页 |
2.1.2 Kendo算法 | 第27-28页 |
2.1.3 CoreDet和RCDC | 第28-29页 |
2.1.4 Grace和DThreads | 第29-31页 |
2.1.5 输入稳定性系统 | 第31页 |
2.2 其他确定性并行技术 | 第31-34页 |
2.2.1 硬件确定性技术 | 第31-32页 |
2.2.2 确定性编程语言 | 第32页 |
2.2.3 确定性操作系统 | 第32-33页 |
2.2.4 确定性算法 | 第33页 |
2.2.5 确定性编程模型 | 第33-34页 |
2.3 记录-回放技术 | 第34-35页 |
2.4 确定性并行系统评价 | 第35-38页 |
第三章 全并行的确定性控制技术 | 第38-61页 |
3.1 FPDet系统设计 | 第38-50页 |
3.1.1 总体设计 | 第38-43页 |
3.1.2 FPDet技术细节 | 第43-47页 |
3.1.3 并行度分析 | 第47-50页 |
3.2 自适应的轮长度调节机制 | 第50-52页 |
3.3 FPDet实现技术 | 第52-54页 |
3.3.1 编译插桩 | 第52-53页 |
3.3.2 运行时库 | 第53-54页 |
3.4 评测 | 第54-59页 |
3.4.1 实验方法 | 第54页 |
3.4.2 确定性 | 第54-55页 |
3.4.3 执行时间 | 第55-57页 |
3.4.4 可扩展性 | 第57页 |
3.4.5 性能稳定性 | 第57-59页 |
3.5 讨论 | 第59-60页 |
3.6 本章小结 | 第60-61页 |
第四章 确定性消息传递技术 | 第61-81页 |
4.1 MPI的不确定性因素 | 第61-64页 |
4.1.1 异步消息传递 | 第61-62页 |
4.1.2 混杂消息接收 | 第62-63页 |
4.1.3 其他不确定因素 | 第63-64页 |
4.2 确定性消息传递技术 | 第64-71页 |
4.2.1 总体设计 | 第64-65页 |
4.2.2 逻辑时钟 | 第65-68页 |
4.2.3 确定性消息等待 | 第68-69页 |
4.2.4 确定性消息映射 | 第69-71页 |
4.3 优化 | 第71-76页 |
4.3.1 性能优化 | 第72页 |
4.3.2 死锁优化 | 第72-76页 |
4.4 评测 | 第76-80页 |
4.4.1 实验方法 | 第76-77页 |
4.4.2 性能 | 第77-78页 |
4.4.3 内存开销 | 第78页 |
4.4.4 可扩展性 | 第78-80页 |
4.5 本章小结 | 第80-81页 |
第五章 无全局同步的确定性并行技术 | 第81-121页 |
5.1 全局同步问题 | 第81-83页 |
5.2 设计思想 | 第83-84页 |
5.3 DLRC模型 | 第84-89页 |
5.3.1 正确性 | 第87-88页 |
5.3.2 兼容性 | 第88-89页 |
5.4 DLRC模型的软件实现 | 第89-97页 |
5.4.1 内存空间设计 | 第89-91页 |
5.4.2 时序关系描述 | 第91-93页 |
5.4.3 执行切片 | 第93-94页 |
5.4.4 内存修改传播 | 第94-97页 |
5.5 确定性同步顺序 | 第97-100页 |
5.5.1 逻辑时钟 | 第97页 |
5.5.2 确定性加锁算法 | 第97-100页 |
5.6 RFDet实现细节和优化 | 第100-111页 |
5.6.1 同步语句实现 | 第100-104页 |
5.6.2 内存修改监控 | 第104-105页 |
5.6.3 动态内存分配 | 第105-106页 |
5.6.4 垃圾收集 | 第106-107页 |
5.6.5 优化技术 | 第107-111页 |
5.7 评测 | 第111-118页 |
5.7.1 实验方法 | 第111-112页 |
5.7.2 确定性 | 第112-113页 |
5.7.3 性能 | 第113-116页 |
5.7.4 可扩展性 | 第116-117页 |
5.7.5 兼容性 | 第117页 |
5.7.6 稳定性和可移植性 | 第117-118页 |
5.8 讨论 | 第118-119页 |
5.9 本章小结 | 第119-121页 |
第六章 结论与展望 | 第121-126页 |
6.1 工作总结 | 第121-123页 |
6.2 研究展望 | 第123-126页 |
致谢 | 第126-129页 |
参考文献 | 第129-139页 |
作者在学期间取得的学术成果 | 第139-140页 |