首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--设计与性能分析论文--容错技术论文

面向CFD并行应用框架的容错技术研究

摘要第1-14页
ABSTRACT第14-17页
第一章 绪论第17-37页
   ·研究背景第18-27页
     ·高性能计算机发展第19-21页
     ·CFD对高性能计算的需求第21-22页
     ·高性能计算面临的可靠性问题第22-24页
     ·面向CFD领域的并行应用开发框架发展现状第24-26页
     ·面向领域框架的容错技术第26-27页
   ·基本概念与相关工作第27-32页
     ·CFD并行应用软件框架相关工作第27-28页
     ·容错的基本概念第28-30页
     ·面向硬件故障的软件容错方法研究现状第30-32页
   ·研究内容第32-34页
     ·硬件故障在CFD并行应用中的传播行为分析第32页
     ·面向CFD并行应用软件框架的容错体系设计第32-33页
     ·基于故障传播分析的应用框架容错优化方法第33-34页
   ·主要创新第34-35页
   ·论文组织第35-37页
第二章 硬件故障在CFD并行应用中的传播行为分析第37-89页
   ·硬件故障在并行程序中传播行为研究现状第37-38页
     ·基于概率的方法第37-38页
     ·基于模型的方法第38页
   ·一种新的并行程序建模方法——状态变迁图 (STG)第38-54页
     ·基本定义第39-41页
     ·交互 (Interaction) 抽象第41-43页
     ·行为 (Behaviour) 抽象第43-45页
     ·基本串行程序的抽象建模第45-50页
     ·并行通信的抽象建模第50-54页
   ·基于STG的硬件故障传播行为分析第54-73页
     ·硬件故障在STG中的表示第54-56页
     ·数据流生错误在STG中的传播分析第56-62页
     ·控制流生错误在STG中的传播分析第62-66页
     ·在STG中的并行错误传播分析第66-73页
   ·基于CFD应用特征的错误传播行为第73-86页
     ·连续CFD模型的错误传播基础第74-81页
     ·基于离散CFD模型的错误传播基础第81-83页
     ·基于统一模板的CFD应用错误传播行为分析第83-86页
   ·本章小结第86-89页
第三章 面向CFD并行应用框架的容错设计第89-111页
   ·CFD并行应用容错框架第89-94页
     ·CFD并行应用框架第89-91页
     ·面向CFD并行应用框架的容错需求和基础第91-92页
     ·面向CFD并行应用框架的容错架构第92-94页
   ·面向CFD并行应用的同步回滚方法第94-102页
     ·基本思想第94-96页
     ·同步checkpoint/restart回滚机制第96-97页
     ·基于FT-MPI的同步回滚设计与实现第97-99页
     ·实验验证与分析第99-102页
   ·面向CFD并行应用的异步回滚方法第102-110页
     ·基本思想第102-103页
     ·应用框架下的消息日志技术第103-105页
     ·基于用户级消息日志的同步回滚设计与实现第105-108页
     ·实验验证与分析第108-110页
   ·本章小结第110-111页
第四章 面向模板计算的软错误检测方法——GS-DMR第111-131页
   ·问题提出第111-113页
     ·模板计算与LBM第111-112页
     ·双模冗余检错 (DMR)第112-113页
   ·基本思想第113-117页
     ·网格采样GS-DMR第113-114页
     ·错误在LBM网格上的传播模式第114-115页
     ·网格采样方法第115-116页
     ·容错框架第116-117页
   ·设计与优化第117-124页
     ·检测盲区现象第117-119页
     ·检错盲区的解决方案第119-121页
     ·容错参数优化第121-124页
   ·实验第124-130页
     ·实验平台第124-125页
     ·测试用例第125页
     ·实验方法第125页
     ·实验结果与分析第125-130页
   ·本章小结第130-131页
第五章 基于异步流水的检查点I/O优化方法——AP-IO第131-149页
   ·动机第132-135页
     ·基于buffer缓冲的文件I/O第132页
     ·CFD模拟过程中的快照输出模式第132-134页
     ·传统写文件优化第134-135页
   ·基本思想第135-137页
     ·AP-IO基本思想第135-136页
     ·可用隐藏时间PST分析第136-137页
   ·AP-IO框架设计第137-139页
     ·编程模型第137-138页
     ·基本架构第138-139页
     ·计算段流水调度优化第139页
   ·AP-IO实现第139-142页
     ·编译支承层第140页
     ·AP-IO库第140-142页
   ·实验第142-147页
     ·测试用例第143页
     ·实验方法第143-145页
     ·实验结果与分析第145-147页
   ·本章小结第147-149页
第六章 结束语第149-153页
   ·论文工作总结第149-150页
   ·课题研究展望第150-153页
致谢第153-155页
参考文献第155-167页
作者在学期间取得的学术成果第167页

论文共167页,点击 下载论文
上一篇:众核加速器的缓存管理
下一篇:异构众核体系结构Cache功耗和性能优化关键技术研究