首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向集群系统的MPI并行程序容错技术研究

第1章 引言第1-16页
   ·并行计算第8-11页
     ·集群系统第9-10页
     ·并行编程模型第10-11页
   ·并行系统容错技术综述第11-16页
     ·故障类型第12页
     ·容错技术第12-13页
     ·集群系统容错第13-15页
     ·本文内容及主要贡献第15-16页
第2章 CRR技术研究第16-34页
   ·系统模型和故障模型第16-18页
   ·理论基础第18-21页
     ·一致性全局状态第18-20页
     ·卷回传播与多米诺效应第20-21页
   ·CRR基本实现技术第21-24页
     ·保存内容第21-22页
     ·如何恢复第22-24页
     ·优化技术第24页
   ·检查点设置协议第24-30页
     ·独立的检查点设置第25页
     ·协调的检查点设置第25-28页
       ·阻塞式协调第25-27页
       ·非阻塞式协调第27-28页
     ·基于消息记录的检查点设置第28-30页
   ·相关工作第30-34页
第3章 消息传递系统MPI分析第34-44页
   ·MPI简介第34-35页
   ·MPICH分析第35-40页
     ·MPICH简介第35-36页
     ·MPICH结构解析第36-40页
       ·ADI详解第36-38页
       ·Channel详解第38-40页
   ·MPICH中的P4第40-44页
     ·P4的启动和退出第40-42页
     ·P4连接建立过程第42-44页
第4章 检查点设置和进程迁移系统ChaRM4MPI第44-68页
   ·系统概述第44-45页
   ·系统逻辑结构和功能第45-46页
   ·系统设计第46-52页
     ·进程注册和退出机制第47-48页
     ·总控模块和用户界面间的通讯协议第48页
     ·总控模块和协调模块间的通讯协议第48-49页
     ·选择检查点的时机第49-52页
   ·系统实现第52-61页
     ·检查点设置第52-56页
     ·卷回恢复第56-58页
     ·进程迁移第58-61页
   ·性能测试第61-68页
     ·同步时间第63页
     ·检查点和卷回恢复时间第63-66页
     ·进程迁移时间第66-68页
第5章 结论第68-72页
   ·研究总结第68页
   ·进一步工作第68-72页
参考文献第72-76页
致谢及声明第76-77页
个人简历、在学期间的研究成果及发表的论文第77页

论文共77页,点击 下载论文
上一篇:SARS新型核酸疫苗的实验研究
下一篇:行动研究:中专计算机教学自主学习策略的运用