Table of Contents | 第2-5页 |
Abstract | 第5页 |
摘要 | 第6-7页 |
Chapter 1 Introduction | 第7-12页 |
1.1 Background | 第7-8页 |
1.2 Motivation and Major Work | 第8-10页 |
1.3 Outline of Thesis | 第10-12页 |
Chapter 2 Foundational and Related Work | 第12-29页 |
2.1 High Availability Terminology and Solutions | 第12-18页 |
2.1.1 High Availability Terminology and Metrics | 第12-14页 |
2.1.2 Involvement of High Availability Solutions | 第14-16页 |
2.1.3 High Availability Related Techniques | 第16-18页 |
2.2 Failure Detection | 第18-24页 |
2.2.1 Causes andTypes of Failures | 第19-20页 |
2.2.2 Failure Detection Techniques | 第20-24页 |
2.3 Failure Recovery | 第24-28页 |
2.3.1 Control-based Recovery | 第25-26页 |
2.3.2 Recovery Oriented Computing | 第26-28页 |
2.4 Summary | 第28-29页 |
Chapter 3 Fine-grained Failure Detection and Recovery Approach | 第29-46页 |
3.1 Motivation and Design Guideline | 第29-31页 |
3.2 Fine-grained Failure Detection and Recovery approach | 第31-42页 |
3.2.1 Inner-process Failure Detection and Recovery | 第35-39页 |
3.2.2 Process-level Failure Detection and Recovery | 第39-40页 |
3.2.3 Inter-process Failure Detection and Recovery | 第40-41页 |
3.2.4 Node-level Failure Detection and Recovery | 第41-42页 |
3.3 Dynamical Reconfiguration | 第42-43页 |
3.4 Summary | 第43-46页 |
Chapter 4 Implementation in 24-hour FB Project | 第46-61页 |
4.1 24-hour FB Project Background | 第46-53页 |
4.1.1 System Background and Motivations | 第46-48页 |
4.1.2 Architecture of 24-hour FB System | 第48-50页 |
4.1.3 Current Failure Detection and Recovery Mechanism | 第50-53页 |
4.2 Fine-grained Failure DR for 24-hour FB project | 第53-61页 |
4.2.1 Overall Architecture | 第54-56页 |
4.2.2 Implementation of Inner-process Failure DR | 第56-57页 |
4.2.3 Implementation of Process-level Failure DR | 第57页 |
4.2.4 Implementation of Inter-Process Failure DR | 第57-58页 |
4.2.5 Implementation of Node-level Failure DR | 第58-59页 |
4.2.6 Unified Interface for Dynamical Reconfiguration | 第59-61页 |
Chapter 5 Evaluation and Results | 第61-68页 |
5.1 Evaluation Metrics and Environment | 第61-62页 |
5.1.1 Evaluation Metrics | 第61-62页 |
5.1.2 Evaluation Environment | 第62页 |
5.2 Testing Results and Observations | 第62-68页 |
5.2.1 Recovery Time | 第63-64页 |
5.2.2 Availability | 第64-66页 |
5.2.3 Performance Overhead | 第66-67页 |
5.2.4 Summary | 第67-68页 |
Chapter 6 Conclusions and Future Work | 第68-70页 |
6.1 Conclusions | 第68-69页 |
6.2 Future Work | 第69-70页 |
References | 第70-73页 |
Acknowledgements | 第73页 |