| 摘要 | 第1-7页 |
| Abstract | 第7-15页 |
| 第一章 绪论 | 第15-37页 |
| ·引言 | 第15-16页 |
| ·典型容错计算机及其故障恢复方法概述 | 第16-24页 |
| ·TANDEM的Nostop Kernel计算机 | 第16-17页 |
| ·Stratus容错计算机 | 第17-18页 |
| ·3500FT容错服务器 | 第18-21页 |
| ·OPIAC/FT-486雅派克容错计算机 | 第21-23页 |
| ·HA容错计算系统 | 第23-24页 |
| ·面向故障恢复的容错计算 | 第24-31页 |
| ·分布式故障恢复技术 | 第24-25页 |
| ·检查点技术 | 第25-27页 |
| ·向前故障恢复 | 第27页 |
| ·向后故障恢复 | 第27-30页 |
| ·恢复块技术 | 第30-31页 |
| ·COTS容错计算机故障恢复需解决的问题 | 第31-35页 |
| ·透明性 | 第32-33页 |
| ·可扩展性、可移植性及灵活性 | 第33页 |
| ·使用领域的局限性 | 第33-34页 |
| ·开销 | 第34-35页 |
| ·论文研究内容 | 第35-37页 |
| 第二章 TMR容错计算故障恢复技术研究 | 第37-57页 |
| ·TMR容错计算体系结构 | 第37-38页 |
| ·术语及符号 | 第38-39页 |
| ·TMR容错计算故障恢复模型及对应恢复策略 | 第39-56页 |
| ·无备份模块或模块不能带电热拔插 | 第40-46页 |
| ·有备份模块或模块能带电热拔插 | 第46-52页 |
| ·性能分析 | 第52-56页 |
| ·本章小结 | 第56-57页 |
| 第三章 实时系统故障恢复技术研究 | 第57-67页 |
| ·引言 | 第57-58页 |
| ·实时系统模型 | 第58-59页 |
| ·卷回恢复策略 | 第59-63页 |
| ·性能分析比较 | 第63-65页 |
| ·本章小结 | 第65-67页 |
| 第四章 基于COTS的容错集群服务器设计 | 第67-89页 |
| ·系统体系结构 | 第67-70页 |
| ·主控节点设计 | 第70-79页 |
| ·主控节点结构 | 第70-71页 |
| ·FMMi模块设计 | 第71-72页 |
| ·软件结构 | 第72-74页 |
| ·单一系统映像 | 第74-75页 |
| ·容错机制 | 第75-79页 |
| ·服务节点设计 | 第79-82页 |
| ·增强设备驱动程序 | 第82页 |
| ·I/O子系统设计 | 第82-84页 |
| ·减少容错开销的措施 | 第84页 |
| ·可靠性、可用性分析 | 第84-86页 |
| ·主控节点可靠性分析 | 第84-85页 |
| ·服务节点可用性分析 | 第85-86页 |
| ·本章小结 | 第86-89页 |
| 第五章 容错集群服务器故障恢复的实现 | 第89-119页 |
| ·永久故障恢复机制 | 第89-90页 |
| ·主控节点永久故障恢复 | 第89-90页 |
| ·服务节点永久故障恢复 | 第90页 |
| ·瞬时故障恢复思想 | 第90-91页 |
| ·故障恢复的总体框架 | 第91-95页 |
| ·检查点保存过程 | 第92-94页 |
| ·进程重建过程 | 第94-95页 |
| ·网络进程恢复 | 第95-101页 |
| ·网络进程恢复技术 | 第95-97页 |
| ·网络进程恢复的实现 | 第97-101页 |
| ·检查点机制的设计与实现 | 第101-115页 |
| ·检查点checkpoint_format文件的格式 | 第101-102页 |
| ·进程检查点的保存 | 第102-112页 |
| ·进程恢复的实现 | 第112-115页 |
| ·实验与分析 | 第115-117页 |
| ·本章小结 | 第117-119页 |
| 结论 | 第119-121页 |
| 参考文献 | 第121-131页 |
| 攻读博士学位期间发表的论文和取得的科研成果 | 第131-133页 |
| 致谢 | 第133-135页 |
| 个人简历 | 第135页 |