基于强化学习的多成品率衰变设备预防维修策略

摘要	第4-5页
Abstract	第5页
1 绪论	第8-16页
1.1 研究背景、目的和意义	第8-10页
1.2 文献综述	第10-13页
1.3 研究内容与方法	第13-14页
1.4 本文的创新之处	第14-15页
1.5 论文结构	第15-16页
2 问题描述及建模	第16-27页
2.1 问题描述	第16-20页
2.2 符号声明及模型假设	第20-23页
2.3 部分可观马氏决策问题建模	第23-26页
2.4 本章小结	第26-27页
3 基于强化学习的求解过程	第27-35页
3.1 强化学习算法——Q-learning 算法	第27-32页
3.2 基于强化学习的预防维修仿真过程	第32-34页
3.3 本章小结	第34-35页
4 算例分析	第35-52页
4.1 与定期预防维修策略的对比分析	第35-40页
4.2 系统参数敏感性分析	第40-50页
4.3 本章小结	第50-52页
5 总结与展望	第52-54页
5.1 总结	第52-53页
5.2 展望	第53-54页
致谢	第54-55页
参考文献	第55-59页
附录 1 （攻读学位期间发表论文的目录）	第59-60页
附录 2 （攻读学位期间参与的科研项目）	第60页