基于强化学习方法的多成品率衰变生产系统维护策略研究

摘要	第4-6页
Abstract	第6-7页
1 绪论	第10-30页
1.1 研究的背景	第10-13页
1.2 研究的目的与意义	第13-14页
1.3 国内外研究现状	第14-27页
1.4 本文研究内容	第27-28页
1.5 小结	第28-30页
2 单台衰变设备的预测维护策略	第30-53页
2.1 引言	第30-32页
2.2 问题描述与建模	第32-36页
2.3 基于Q-P学习的最优维护策略	第36-40页
2.4 维护时间的预测	第40-42页
2.5 算例分析	第42-51页
2.6 小结	第51-53页
3 2MlB流水线衰变设备的维护策略	第53-66页
3.1 引言	第53-55页
3.2 问题描述与建模	第55-57页
3.3 基于costs-sharing-RL方法的维护策略	第57-62页
3.4 算例分析	第62-65页
3.5 小结	第65-66页
4 资源受限的2M1B流水线衰变设备维护策略	第66-80页
4.1 引言	第66-67页
4.2 问题描述与建模	第67-71页
4.3 基于RC-costs-sharing-RL方法的维护策略	第71-72页
4.4 算例分析	第72-78页
4.5 小结	第78-80页
5 启发式加速的多Agent强化学习方法	第80-95页
5.1 引言	第80-81页
5.2 基于传统启发式搜索技术的多Agent强化学习方法	第81-85页
5.3 启发式函数加速的多Agent强化学习方法	第85-87页
5.4 仿真实验与结果分析	第87-94页
5.5 小结	第94-95页
6 总结与展望	第95-99页
6.1 全文总结	第95-97页
6.2 研究展望	第97-99页
致谢	第99-101页
参考文献	第101-114页
附录1 攻读博士学位期间发表的学术论文	第114-115页
附录2 公开发表的学术论文与博士学位论文的关系	第115-116页
附录3 攻读博士学位期间参加的科研项目	第116页