强化学习算法的研究与实验

摘要	第5-6页
ABSTRACT	第6页
符号对照表	第9-11页
缩略语对照表	第11-14页
第一章绪论	第14-22页
1.1 课题的背景和意义	第14-15页
1.2 强化学习的发展过程	第15-18页
1.3 强化学习的研究现状	第18-20页
1.4 本文的主要研究工作	第20-22页
第二章强化学习理论概述	第22-30页
2.1 强化学习(RL)简述	第22-23页
2.2 强化学习理论基础	第23-27页
2.3 举例	第27-29页
2.4 本章小结	第29-30页
第三章基于Q-learning算法的柔性结构控制器	第30-46页
3.1 柔性尺建模	第30-35页
3.1.1 柔性尺物理模型	第30-34页
3.1.2 柔性尺物理模型的仿真	第34-35页
3.2 基于Q-learning算法控制器的构造	第35-40页
3.2.1 基于Q-learning算法控制器的构造	第35-38页
3.2.2 基于Q-learning算法控制器收敛性证明	第38-40页
3.3 基于Q-learning算法的控制器仿真	第40-45页
3.4 本章小结	第45-46页
第四章基于PD+Q-learning算法的柔性结构控制器	第46-56页
4.1 Q-learning算法与PD算法的结合	第46-50页
4.1.1 PID算法简介	第46-48页
4.1.2 Q-learning算法与PD算法结合	第48-50页
4.2 PD+Q-learning型柔性结构控制器仿真	第50-54页
4.3 本章小结	第54-56页
第五章总结与展望	第56-58页
5.1 总结	第56页
5.2 展望	第56-58页
参考文献	第58-62页
致谢	第62-64页
作者简介	第64-65页
1.基本情况	第64页
2.教育背景	第64-65页