基于数据驱动的离散系统迭代学习控制与强化学习控制的研究
中文摘要 | 第1-6页 |
ABSTRACT | 第6-9页 |
1. 绪论 | 第9-12页 |
·研究背景及意义 | 第9页 |
·国内外研究现状 | 第9-11页 |
·控制理论及控制工程的研究现状及发展 | 第9-10页 |
·数据驱动控制的研究现状及发展 | 第10-11页 |
·论文研究内容及组织结构 | 第11-12页 |
2. 基本理论知识 | 第12-19页 |
·最优控制的基本理论 | 第12-15页 |
·最优控制 | 第12-13页 |
·动态规划 | 第13-15页 |
·不适定问题和Tikhonov正则化 | 第15-19页 |
·不适定问题 | 第16-17页 |
·Tikhonov正则化 | 第17-19页 |
3. 基于数据驱动的迭代学习控制 | 第19-32页 |
·迭代学习控制 | 第19-20页 |
·基于数据的迭代学习控制的不适定性 | 第20-24页 |
·模型知识 | 第20-22页 |
·基于正则化理论的迭代学习控制修正公式 | 第22页 |
·关于初值的进一步讨论 | 第22-24页 |
·基于正则化理论的迭代学习算法 | 第24页 |
·算例仿真 | 第24-31页 |
·本章小结 | 第31-32页 |
4. 基于数据驱动的强化学习控制 | 第32-48页 |
·引言 | 第32页 |
·模型描述 | 第32-36页 |
·线性二次型调节器问题的不适定性 | 第32-34页 |
·差分,PI算法和VI算法 | 第34-36页 |
·基于输出反馈(OPFB)的PI算法和VI算法 | 第36-41页 |
·关于可测数据的价值函数[59] | 第37-39页 |
·关于可测数据的差分误差和策略修正 | 第39-40页 |
·基于OPFB的PI算法 | 第40-41页 |
·基于OPFB的VI算法 | 第41页 |
·算例仿真 | 第41-47页 |
·OPFB VI算法的实例仿真 | 第41-45页 |
·OPFB PI算法的实例仿真 | 第45-47页 |
·本章小结 | 第47-48页 |
5. 结论与展望 | 第48-49页 |
·结论 | 第48页 |
·展望 | 第48-49页 |
参考文献 | 第49-53页 |
攻读硕士学位期间发表学术论文情况 | 第53-54页 |
致谢 | 第54-55页 |
作者简介 | 第55页 |