首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

高可用MPI并行编程环境及并行程序开发方法的研究与实现

摘要第1-14页
ABSTRACT第14-16页
第一章 绪论第16-28页
   ·课题研究背景第16-20页
     ·高性能计算机的作用与形式第16-17页
     ·大规模并行计算机系统的发展趋势和面临的挑战第17-19页
     ·大规模并行计算机系统的可用性第19-20页
   ·相关研究工作第20-25页
     ·高性能互连通信软硬件接口第20-21页
     ·高性能、可扩展、容错MPI系统第21-22页
     ·消息传递系统中基于检查点的回卷恢复第22-25页
   ·本文的研究内容和创新第25-27页
   ·论文结构第27-28页
第二章 面向大规模并行计算机系统的互连通信接口第28-50页
   ·研究背景第28-29页
   ·CNI互连通信硬件接口第29-32页
     ·通信机制第29-30页
     ·结构设计第30-32页
   ·CMEX通信软件接口第32-38页
     ·设计目标第32-33页
     ·总体结构第33-34页
     ·关键实现技术第34-38页
   ·性能评测第38-43页
     ·测试平台第38页
     ·测试方法第38-39页
     ·测试结果第39-43页
   ·与相关工作的对比第43-44页
   ·CMEX通信软件接口的验证第44-49页
     ·静态程序分析第45页
     ·模型检验第45-49页
   ·小结第49-50页
第三章 高性能、可扩展MPI并行编程环境第50-77页
   ·研究背景第50-54页
     ·MPI实现相关问题第50-51页
     ·MPICH2系统结构第51页
     ·数据传输协议第51-52页
     ·虚连接与消息队列第52-53页
     ·通道接口第53-54页
   ·基于RDMA的数据传输第54-55页
   ·基于RDMA写的消息数据传输第55-59页
     ·传输算法第55-57页
     ·实现细节第57-59页
     ·流控策略第59页
     ·资源消耗第59页
   ·基于RDMA读的消息数据传输第59-65页
     ·传输算法第59-63页
     ·流控策略第63页
     ·动态反馈信用流控第63-65页
   ·组合通道消息数据传输第65-67页
     ·并行应用的近邻通信模式第65-66页
     ·通道选择方法第66-67页
     ·资源消耗第67页
   ·性能评测第67-75页
     ·测试平台第67页
     ·测试程序第67-68页
     ·通信延迟和带宽第68-70页
     ·流控测试第70-72页
     ·组合通道性能对比第72-73页
     ·NPB应用性能第73-75页
   ·与相关工作的对比第75页
   ·小结第75-77页
第四章 完全用户透明的MPI并行检查点系统第77-97页
   ·研究背景第77-80页
     ·基于检查点的回卷恢复第78页
     ·单机检查点第78-79页
     ·检查点映像文件存储第79-80页
   ·设计思想第80-83页
     ·全局一致状态第80页
     ·并行检查点系统结构第80-82页
     ·检查点操作流程第82-83页
   ·协同协议的实现第83-87页
     ·信号与临界区处理第83-85页
     ·通道清空操作过程第85-86页
     ·协议消息的处理第86页
     ·通道的关闭和重建第86-87页
   ·性能评测第87-91页
     ·测试环境第87页
     ·测试方法第87-88页
     ·检查点开销第88-90页
     ·回卷恢复开销第90-91页
   ·I/O操作的优化策略第91-92页
   ·周期性检查点第92-93页
   ·用户主动的并行检查点第93-94页
   ·与相关工作的对比第94-96页
   ·小结第96-97页
第五章 面向MPI程序的容错并行算法设计方法第97-114页
   ·面向MPI并行应用的容错方法第97-101页
     ·系统级容错方法第97-98页
     ·用户级检查点技术第98页
     ·Diskless检查点方法第98-99页
     ·容错MPI环境第99-100页
     ·针对特定应用的容错算法第100页
     ·研究思路第100-101页
   ·容错并行算法FTPA第101-111页
     ·FTPA算法的故障模型第101-102页
     ·FTPA算法设计思想和流程第102-104页
     ·FTPA算法中的容错处理第104-105页
     ·进程间定值—引用分析方法第105-107页
     ·实例研究第107-109页
     ·反映处理器失效故障的加速比第109-111页
   ·性能评测第111-112页
     ·容错印程序测试第111-112页
     ·容错 FT程序测试第112页
   ·小结第112-114页
第六章 结束语第114-117页
   ·工作总结第114-115页
   ·研究展望第115-117页
致谢第117-118页
参考文献第118-126页
作者在学期间取得的学术成果第126-127页
攻读博士学位期间参加的科研项目和获奖情况第127页

论文共127页,点击 下载论文
上一篇:无形交换成本与人际信任消逝--社会交换与现代性建构
下一篇:基于密度的并行聚类算法研究