一类非线性系统的自强化学习自抗扰控制研究

摘要	第4-6页
ABSTRACT	第6-8页
第一章绪论	第14-20页
1.1 引言	第14-15页
1.2 前人的研究成果	第15-17页
1.2.1 强化学习的发展与现状	第15-16页
1.2.2 自抗扰的发展与研究现状	第16-17页
1.3 本文研究的内容	第17-20页
第二章强化学习与自抗扰基础理论	第20-30页
2.1 引言	第20页
2.2 强化学习理论基础	第20-25页
2.2.1 马尔可夫决策过程	第20-21页
2.2.2 值函数	第21-22页
2.2.3 时间差分	第22-23页
2.2.4 AC结构的强化学习	第23-24页
2.2.5 在线自适应规划	第24-25页
2.3 自抗扰控制	第25-29页
2.3.1 跟踪微分器	第26-27页
2.3.2 扩张状态观测器	第27页
2.3.3 状态误差反馈控制律	第27-28页
2.3.4 线性自抗扰控制	第28-29页
2.4 本章小结	第29-30页
第三章基于ESO的强化学习控制器设计与仿真研究	第30-42页
3.1 引言	第30页
3.2 纯反馈系统及预备知识	第30-33页
3.2.1 纯反馈系统	第30-31页
3.2.2 纯反馈系统的转换	第31-33页
3.3 RL-ESO控制器设计	第33-38页
3.3.1 RL-ESO结构	第33-34页
3.3.2 ESO的设计	第34-35页
3.3.3 RLC的设计	第35-38页
3.4 仿真实验与分析	第38-40页
3.5 本章小结	第40-42页
第四章基于线性自抗扰的强化学习控制	第42-52页
4.1 线性自抗扰控制器设计	第42-43页
4.2 RL-ADRC控制器的设计	第43-45页
4.2.1 评价网络设计	第43-44页
4.2.2 线性自抗扰执行器	第44页
4.2.3 线性自抗扰执行器的参数更新律	第44-45页
4.3 实验结果与分析	第45-51页
4.4 本章小结	第51-52页
第五章总结与展望	第52-54页
5.1 总结	第52-53页
5.2 展望	第53-54页
参考文献	第54-60页
致谢	第60-62页
研究成果及发表的学术论文	第62-64页
导师和作者简介	第64-66页
附件	第66-67页