首页--工业技术论文--机械、仪表工业论文--机械运行与维修论文

基于强化学习的劣化系统维修策略研究

摘要第1-6页
ABSTRACT第6-7页
致谢第7-12页
第一章 绪论第12-21页
   ·可靠性概述第12页
   ·劣化系统概述第12-16页
   ·强化学习方法第16-19页
     ·强化学习的定义第16-17页
     ·强化学习的主要元素第17页
     ·常见的强化学习算法第17-19页
     ·强化学习的优点第19页
   ·论文内容和结构安排第19-21页
第二章 基本模型及其优化算法第21-30页
   ·半 Markov 决策过程第21-25页
     ·SMDP 概述第21-23页
     ·SMDP 的数学模型第23-24页
     ·SMDP 的主要优化算法第24-25页
   ·部分可观 Markov 决策过程第25-29页
     ·POMDP 概述第25-26页
     ·POMDP 的数学模型第26-28页
     ·POMDP 的主要优化算法第28-29页
   ·本章小结第29-30页
第三章 基于 SMDP 的劣化系统的维修策略研究第30-40页
   ·完全可观的劣化系统第30-32页
     ·系统描述第30-31页
     ·系统假设第31-32页
   ·劣化系统的 SMDP 模型第32-34页
   ·学习优化算法第34-37页
     ·模拟退火方法第34-35页
     ·基于模拟退火思想的 Q 学习算法第35-37页
   ·实验仿真第37-39页
   ·本章小结第39-40页
第四章 基于 POSMDP 的劣化系统维修策略研究第40-51页
   ·部分可观的劣化系统第40-41页
     ·系统描述第40-41页
     ·系统假设第41页
   ·劣化系统的 POSMDP 模型第41-44页
   ·学习优化算法第44-47页
     ·Sarsa ( λ )算法第44-45页
     ·NSM 算法第45-47页
   ·实验仿真第47-50页
   ·本章小结第50-51页
第五章 总结第51-52页
参考文献第52-56页
硕士期间发表论文与参与项目第56页

论文共56页,点击 下载论文
上一篇:多个MEMS加速度计融合的数字倾角仪
下一篇:基于Petri网的线束工艺路线优化研究