基于数据的ADP离线值迭代算法和在线Q学习算法研究

摘要	第1-6页
ABSTRACT	第6-10页
第一章绪论	第10-15页
·课题背景及意义	第10-11页
·基于数据控制方法及其理论研究现状	第11-12页
·基于数据的自适应动态规划的研究现状	第12-14页
·自适应动态规划的发展	第12-13页
·基于数据自适应动态规划的发展	第13-14页
·本文的主要工作	第14-15页
第二章离散非线性系统自适应动态规划控制方法	第15-24页
·本章引言	第15页
·离散非线性系统最优控制问题	第15-16页
·自适应动态规划值迭代算法	第16-17页
·自适应动态规划策略迭代算法	第17-18页
·自适应动态规划策略迭代算法和值迭代算法区别	第18页
·Q学习	第18-19页
·Q学习策略迭代算法	第19页
·离线值迭代算法和在线Q学习策略迭代算法相结合	第19-23页
·本章小结	第23-24页
第三章基于数据自适应动态规划离线值迭代算法	第24-38页
·本章引言	第24页
·基于数据自适应动态规划离线值迭代算法	第24-27页
·基于数据自适应动态规划离线值迭代算法的神经网络实现	第27-29页
·仿真分析	第29-37页
·糖厂澄清工段系统及其基于数据的建模	第29-33页
·糖厂澄清工段系统中和PH值的离线优化控制	第33-37页
·本章小结	第37-38页
第四章基于数据离线值迭算法和在线Q学习算法的结合	第38-50页
·本章引言	第38页
·在线Q学习策略迭代算法	第38-40页
·Q学习策略迭代算法的神经网络实现及其权值的调整	第40-42页
·基于数据离线值迭代算法和在线Q学习策略迭代算法的结合	第42-44页
·仿真分析	第44-49页
·本章小结	第49-50页
第五章总结与展望	第50-52页
·总结	第50-51页
·下一步工作与展望	第51-52页
参考文献	第52-55页
致谢	第55-56页
攻读学位期间发表的学术论文	第56页