大规模分布式仿真系统容错关键技术研究

摘要	第1-14页
ABSTRACT	第14-16页
第一章绪论	第16-34页
§1.1 研究背景	第16-18页
§1.2 分布式系统容错的发展现状	第18-29页
·分布式计算领域中的容错研究	第19-27页
·仿真领域的容错研究	第27-29页
·分布式仿真系统容错的发展方向	第29页
§1.3 论文的主要研究内容、组织结构与主要贡献	第29-34页
·论文的主要研究内容	第29-30页
·论文的组织结构	第30-31页
·论文的主要贡献	第31-34页
第二章分布式仿真容错系统框架结构设计	第34-51页
§2.1 网格对解决分布式仿真系统相关问题的启示	第34-37页
·网格的演变	第34-35页
·对解决仿真系统相关问题的启示	第35-37页
§2.2 仿真系统的容错方法	第37-39页
·容错的影响因素	第37-38页
·仿真系统全过程容错	第38-39页
§2.3 分布式仿真容错系统的容错等级分析	第39-41页
·仿真系统故障分析	第39-40页
·容错等级分析	第40-41页
§2.4 分布式仿真系统的容错设计模式	第41-43页
·仿真系统的容错设计模式	第41-43页
·仿真任务的容错设计模式	第43页
§2.5 分布式仿真容错系统的框架结构设计	第43-50页
·DS-FTS的构成分析	第43-45页
·DS-FTS与仿真系统的相对关系分析	第45-47页
·DS-FTS的层次与功能结构设计	第47-50页
§2.6 小结	第50-51页
第三章大规模分布式仿真系统的失效探测算法研究	第51-69页
§3.1 分布式仿真系统的时间特性分析	第51-52页
§3.2 预备知识	第52-54页
·系统模型	第52-53页
·失效探测策略比较	第53页
·相关术语	第53-54页
§3.3 UA-DSD算法	第54-60页
·系统状态变化对算法的影响	第54-55页
·其它不确定性因素对算法的影响	第55-57页
·算法描述	第57-58页
·算法正确性证明	第58-60页
§3.4 HI-UA-DSD算法	第60-67页
·层次式失效探测策略	第60-61页
·UA-DSD-Int算法	第61-63页
·Hi-UA-DSD算法描述及正确性证明	第63-64页
·算法评估	第64-66页
·本部分的研究结论	第66-67页
§3.5 进一步讨论	第67-68页
§3.6 小结	第68-69页
第四章非阻塞式协同检查点协议及失效恢复一致性研究	第69-91页
§4.1 IEEE 1516-2000联邦存储协议分析	第69-71页
·IEEE 1516-2000中的联邦存储概述	第69-70页
·存储协议对比分析	第70-71页
§4.2 CICCP协议	第71-85页
·模型和理论	第71-73页
·相关工作	第73页
·HLA仿真系统分析	第73-74页
·CICCP协议的影响因素分析及解决方法	第74-81页
·协议描述	第81页
·协议正确性证明及分析	第81-84页
·其它方法	第84-85页
§4.3 失效恢复一致性研究	第85-90页
·问题描述	第85-86页
·恢复一致性的影响因素	第86页
·普通HLA仿真系统ACS恢复一致性研究	第86-88页
·实时HLA仿真系统ACS恢复一致性研究	第88-90页
§4.4 小结	第90-91页
第五章失效恢复策略及容错参数研究	第91-106页
§5.1 相关定义及模型	第91-92页
·可用度定义	第91页
·系统模型及相关假设	第91-92页
§5.2 失效恢复策略研究	第92-99页
·两类恢复策略下系统的可用度	第93-94页
·相关工作	第94页
·基于Markov链的可用度分析	第94-97页
·数值分析	第97-99页
·一种改进的失效恢复策略	第99页
§5.3 最佳检查点间隔研究	第99-102页
·改进的恢复策略下系统的可用度	第99-101页
·数值分析	第101-102页
§5.4 最佳心跳间隔研究	第102-105页
·模型扩展	第102-103页
·可用度分析	第103-104页
·数值分析	第104-105页
§5.5 小结	第105-106页
第六章分布式仿真系统容错调度算法研究	第106-128页
§6.1 模型描述	第106-107页
·系统模型	第106页
·任务模型	第106-107页
§6.2 分布式仿真系统的调度特征	第107-108页
§6.3 基于ICM的调度算法框架	第108-109页
§6.4 CSP-RTFT算法	第109-115页
·相关工作	第110页
·仿真任务的WCRT分析	第110-112页
·可调度性分析规则	第112页
·算法描述	第112-113页
·算法仿真	第113-115页
·结论	第115页
§6.5 基于PB模型的容错调度算法研究	第115-127页
·异构分布式系统容错调度的一般规律	第116页
·可调度性分析规则	第116-117页
·MW-RTFT算法	第117-121页
·RC-RTFT算法	第121-127页
§6.6 小结	第127-128页
第七章分布式仿真容错系统的实现与应用	第128-149页
§7.1 仿真资源管理模块	第128-131页
·资源状态监控	第129页
·FDS的设计与实现	第129-131页
§7.2 系统状态保存与恢复模块	第131-140页
·用户级的检查点机制	第131-132页
·内核级的检查点机制	第132-134页
·CICCP协议的实现	第134-136页
·Socket迁移的设计与实现	第136-140页
§7.3 容错调度模块的设计与实现	第140-142页
·任务分配器	第140-141页
·任务调度器	第141-142页
§7.4 具有容错功能的XX对抗仿真系统的应用示例	第142-148页
·系统构成	第142页
·系统容错设计	第142-144页
·基于DS-FTS的仿真应用执行过程	第144-147页
·测试结论	第147-148页
§7.5 小结	第148-149页
第八章结论与展望	第149-152页
§8.1 论文工作总结	第149-150页
§8.2 进一步工作展望	第150-152页
攻读博士学位期间发表的论文	第152-153页
攻读博士学位期间参加的科研工作	第153-154页
致谢	第154-155页
参考文献	第155-164页