| 摘要 | 第1-14页 |
| ABSTRACT | 第14-16页 |
| 第一章 绪论 | 第16-34页 |
| §1.1 研究背景 | 第16-18页 |
| §1.2 分布式系统容错的发展现状 | 第18-29页 |
| ·分布式计算领域中的容错研究 | 第19-27页 |
| ·仿真领域的容错研究 | 第27-29页 |
| ·分布式仿真系统容错的发展方向 | 第29页 |
| §1.3 论文的主要研究内容、组织结构与主要贡献 | 第29-34页 |
| ·论文的主要研究内容 | 第29-30页 |
| ·论文的组织结构 | 第30-31页 |
| ·论文的主要贡献 | 第31-34页 |
| 第二章 分布式仿真容错系统框架结构设计 | 第34-51页 |
| §2.1 网格对解决分布式仿真系统相关问题的启示 | 第34-37页 |
| ·网格的演变 | 第34-35页 |
| ·对解决仿真系统相关问题的启示 | 第35-37页 |
| §2.2 仿真系统的容错方法 | 第37-39页 |
| ·容错的影响因素 | 第37-38页 |
| ·仿真系统全过程容错 | 第38-39页 |
| §2.3 分布式仿真容错系统的容错等级分析 | 第39-41页 |
| ·仿真系统故障分析 | 第39-40页 |
| ·容错等级分析 | 第40-41页 |
| §2.4 分布式仿真系统的容错设计模式 | 第41-43页 |
| ·仿真系统的容错设计模式 | 第41-43页 |
| ·仿真任务的容错设计模式 | 第43页 |
| §2.5 分布式仿真容错系统的框架结构设计 | 第43-50页 |
| ·DS-FTS的构成分析 | 第43-45页 |
| ·DS-FTS与仿真系统的相对关系分析 | 第45-47页 |
| ·DS-FTS的层次与功能结构设计 | 第47-50页 |
| §2.6 小结 | 第50-51页 |
| 第三章 大规模分布式仿真系统的失效探测算法研究 | 第51-69页 |
| §3.1 分布式仿真系统的时间特性分析 | 第51-52页 |
| §3.2 预备知识 | 第52-54页 |
| ·系统模型 | 第52-53页 |
| ·失效探测策略比较 | 第53页 |
| ·相关术语 | 第53-54页 |
| §3.3 UA-DSD算法 | 第54-60页 |
| ·系统状态变化对算法的影响 | 第54-55页 |
| ·其它不确定性因素对算法的影响 | 第55-57页 |
| ·算法描述 | 第57-58页 |
| ·算法正确性证明 | 第58-60页 |
| §3.4 HI-UA-DSD算法 | 第60-67页 |
| ·层次式失效探测策略 | 第60-61页 |
| ·UA-DSD-Int算法 | 第61-63页 |
| ·Hi-UA-DSD算法描述及正确性证明 | 第63-64页 |
| ·算法评估 | 第64-66页 |
| ·本部分的研究结论 | 第66-67页 |
| §3.5 进一步讨论 | 第67-68页 |
| §3.6 小结 | 第68-69页 |
| 第四章 非阻塞式协同检查点协议及失效恢复一致性研究 | 第69-91页 |
| §4.1 IEEE 1516-2000联邦存储协议分析 | 第69-71页 |
| ·IEEE 1516-2000中的联邦存储概述 | 第69-70页 |
| ·存储协议对比分析 | 第70-71页 |
| §4.2 CICCP协议 | 第71-85页 |
| ·模型和理论 | 第71-73页 |
| ·相关工作 | 第73页 |
| ·HLA仿真系统分析 | 第73-74页 |
| ·CICCP协议的影响因素分析及解决方法 | 第74-81页 |
| ·协议描述 | 第81页 |
| ·协议正确性证明及分析 | 第81-84页 |
| ·其它方法 | 第84-85页 |
| §4.3 失效恢复一致性研究 | 第85-90页 |
| ·问题描述 | 第85-86页 |
| ·恢复一致性的影响因素 | 第86页 |
| ·普通HLA仿真系统ACS恢复一致性研究 | 第86-88页 |
| ·实时HLA仿真系统ACS恢复一致性研究 | 第88-90页 |
| §4.4 小结 | 第90-91页 |
| 第五章 失效恢复策略及容错参数研究 | 第91-106页 |
| §5.1 相关定义及模型 | 第91-92页 |
| ·可用度定义 | 第91页 |
| ·系统模型及相关假设 | 第91-92页 |
| §5.2 失效恢复策略研究 | 第92-99页 |
| ·两类恢复策略下系统的可用度 | 第93-94页 |
| ·相关工作 | 第94页 |
| ·基于Markov链的可用度分析 | 第94-97页 |
| ·数值分析 | 第97-99页 |
| ·一种改进的失效恢复策略 | 第99页 |
| §5.3 最佳检查点间隔研究 | 第99-102页 |
| ·改进的恢复策略下系统的可用度 | 第99-101页 |
| ·数值分析 | 第101-102页 |
| §5.4 最佳心跳间隔研究 | 第102-105页 |
| ·模型扩展 | 第102-103页 |
| ·可用度分析 | 第103-104页 |
| ·数值分析 | 第104-105页 |
| §5.5 小结 | 第105-106页 |
| 第六章 分布式仿真系统容错调度算法研究 | 第106-128页 |
| §6.1 模型描述 | 第106-107页 |
| ·系统模型 | 第106页 |
| ·任务模型 | 第106-107页 |
| §6.2 分布式仿真系统的调度特征 | 第107-108页 |
| §6.3 基于ICM的调度算法框架 | 第108-109页 |
| §6.4 CSP-RTFT算法 | 第109-115页 |
| ·相关工作 | 第110页 |
| ·仿真任务的WCRT分析 | 第110-112页 |
| ·可调度性分析规则 | 第112页 |
| ·算法描述 | 第112-113页 |
| ·算法仿真 | 第113-115页 |
| ·结论 | 第115页 |
| §6.5 基于PB模型的容错调度算法研究 | 第115-127页 |
| ·异构分布式系统容错调度的一般规律 | 第116页 |
| ·可调度性分析规则 | 第116-117页 |
| ·MW-RTFT算法 | 第117-121页 |
| ·RC-RTFT算法 | 第121-127页 |
| §6.6 小结 | 第127-128页 |
| 第七章 分布式仿真容错系统的实现与应用 | 第128-149页 |
| §7.1 仿真资源管理模块 | 第128-131页 |
| ·资源状态监控 | 第129页 |
| ·FDS的设计与实现 | 第129-131页 |
| §7.2 系统状态保存与恢复模块 | 第131-140页 |
| ·用户级的检查点机制 | 第131-132页 |
| ·内核级的检查点机制 | 第132-134页 |
| ·CICCP协议的实现 | 第134-136页 |
| ·Socket迁移的设计与实现 | 第136-140页 |
| §7.3 容错调度模块的设计与实现 | 第140-142页 |
| ·任务分配器 | 第140-141页 |
| ·任务调度器 | 第141-142页 |
| §7.4 具有容错功能的XX对抗仿真系统的应用示例 | 第142-148页 |
| ·系统构成 | 第142页 |
| ·系统容错设计 | 第142-144页 |
| ·基于DS-FTS的仿真应用执行过程 | 第144-147页 |
| ·测试结论 | 第147-148页 |
| §7.5 小结 | 第148-149页 |
| 第八章 结论与展望 | 第149-152页 |
| §8.1 论文工作总结 | 第149-150页 |
| §8.2 进一步工作展望 | 第150-152页 |
| 攻读博士学位期间发表的论文 | 第152-153页 |
| 攻读博士学位期间参加的科研工作 | 第153-154页 |
| 致谢 | 第154-155页 |
| 参考文献 | 第155-164页 |