首页--数理科学和化学论文--控制论、信息论(数学理论)论文--最优控制论文

基于数据的ADP离线值迭代算法和在线Q学习算法研究

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-15页
   ·课题背景及意义第10-11页
   ·基于数据控制方法及其理论研究现状第11-12页
   ·基于数据的自适应动态规划的研究现状第12-14页
     ·自适应动态规划的发展第12-13页
     ·基于数据自适应动态规划的发展第13-14页
   ·本文的主要工作第14-15页
第二章 离散非线性系统自适应动态规划控制方法第15-24页
   ·本章引言第15页
   ·离散非线性系统最优控制问题第15-16页
   ·自适应动态规划值迭代算法第16-17页
   ·自适应动态规划策略迭代算法第17-18页
   ·自适应动态规划策略迭代算法和值迭代算法区别第18页
   ·Q学习第18-19页
   ·Q学习策略迭代算法第19页
   ·离线值迭代算法和在线Q学习策略迭代算法相结合第19-23页
   ·本章小结第23-24页
第三章 基于数据自适应动态规划离线值迭代算法第24-38页
     ·本章引言第24页
   ·基于数据自适应动态规划离线值迭代算法第24-27页
   ·基于数据自适应动态规划离线值迭代算法的神经网络实现第27-29页
   ·仿真分析第29-37页
     ·糖厂澄清工段系统及其基于数据的建模第29-33页
     ·糖厂澄清工段系统中和PH值的离线优化控制第33-37页
   ·本章小结第37-38页
第四章 基于数据离线值迭算法和在线Q学习算法的结合第38-50页
   ·本章引言第38页
   ·在线Q学习策略迭代算法第38-40页
   ·Q学习策略迭代算法的神经网络实现及其权值的调整第40-42页
   ·基于数据离线值迭代算法和在线Q学习策略迭代算法的结合第42-44页
   ·仿真分析第44-49页
   ·本章小结第49-50页
第五章 总结与展望第50-52页
   ·总结第50-51页
   ·下一步工作与展望第51-52页
参考文献第52-55页
致谢第55-56页
攻读学位期间发表的学术论文第56页

论文共56页,点击 下载论文
上一篇:面向交通拥挤问题的收费定价模型研究
下一篇:公路路基填筑厚度检测的瑞雷面波方法及理论研究