| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 第一章 绪论 | 第10-15页 |
| ·课题背景及意义 | 第10-11页 |
| ·基于数据控制方法及其理论研究现状 | 第11-12页 |
| ·基于数据的自适应动态规划的研究现状 | 第12-14页 |
| ·自适应动态规划的发展 | 第12-13页 |
| ·基于数据自适应动态规划的发展 | 第13-14页 |
| ·本文的主要工作 | 第14-15页 |
| 第二章 离散非线性系统自适应动态规划控制方法 | 第15-24页 |
| ·本章引言 | 第15页 |
| ·离散非线性系统最优控制问题 | 第15-16页 |
| ·自适应动态规划值迭代算法 | 第16-17页 |
| ·自适应动态规划策略迭代算法 | 第17-18页 |
| ·自适应动态规划策略迭代算法和值迭代算法区别 | 第18页 |
| ·Q学习 | 第18-19页 |
| ·Q学习策略迭代算法 | 第19页 |
| ·离线值迭代算法和在线Q学习策略迭代算法相结合 | 第19-23页 |
| ·本章小结 | 第23-24页 |
| 第三章 基于数据自适应动态规划离线值迭代算法 | 第24-38页 |
| ·本章引言 | 第24页 |
| ·基于数据自适应动态规划离线值迭代算法 | 第24-27页 |
| ·基于数据自适应动态规划离线值迭代算法的神经网络实现 | 第27-29页 |
| ·仿真分析 | 第29-37页 |
| ·糖厂澄清工段系统及其基于数据的建模 | 第29-33页 |
| ·糖厂澄清工段系统中和PH值的离线优化控制 | 第33-37页 |
| ·本章小结 | 第37-38页 |
| 第四章 基于数据离线值迭算法和在线Q学习算法的结合 | 第38-50页 |
| ·本章引言 | 第38页 |
| ·在线Q学习策略迭代算法 | 第38-40页 |
| ·Q学习策略迭代算法的神经网络实现及其权值的调整 | 第40-42页 |
| ·基于数据离线值迭代算法和在线Q学习策略迭代算法的结合 | 第42-44页 |
| ·仿真分析 | 第44-49页 |
| ·本章小结 | 第49-50页 |
| 第五章 总结与展望 | 第50-52页 |
| ·总结 | 第50-51页 |
| ·下一步工作与展望 | 第51-52页 |
| 参考文献 | 第52-55页 |
| 致谢 | 第55-56页 |
| 攻读学位期间发表的学术论文 | 第56页 |