基于核的连续空间增强学习方法及应用研究

摘要	第1-10页
ABSTRACT	第10-12页
第一章绪论	第12-21页
·研究背景概述	第12-13页
·连续空间增强学习的发展现状及趋势	第13-18页
·连续空间增强学习理论及算法的研究现状	第13-16页
·连续空间增强学习方法的实际应用及发展趋势	第16-18页
·核方法的发展现状及趋势	第18-19页
·核方法的发展现状	第18-19页
·核方法的应用趋势	第19页
·本文主要研究内容及成果	第19-21页
第二章连续空间增强学习理论及其算法实现	第21-44页
·ACD 方法的理论基础	第21-26页
·Markov 决策问题	第21-24页
·动态规划理论	第24-26页
·ACD 方法的理论框架与算法原理	第26-30页
·HDP 方法（启发式动态规划）	第27-28页
·DHP 方法（对偶启发式规划）	第28-29页
·GDHP 方法（全局对偶启发式规划）	第29-30页
·DHP 方法的算法实现及仿真研究	第30-43页
·Cart-Pole 平衡控制的问题描述	第30页
·控制对象的系统建模	第30-32页
·传统控制器设计与仿真	第32-34页
·基于DHP 方法的控制器设计与仿真	第34-39页
·各类方法的控制效果分析	第39-43页
·小结	第43-44页
第三章连续空间增强学习方法的改进及应用研究	第44-60页
·基于RLS-TD（λ）的连续空间增强学习方法	第44-48页
·基于RLS-TD（λ）的改进DHP 方法	第45-47页
·基于RLS-TD（λ）的改进DHP 方法收敛性分析	第47-48页
·RLS-DHP 方法的算法实现及仿真研究	第48-58页
·CSTR 问题的模型描述	第48-50页
·CSTR 问题的DHP 学习控制器设计与分析	第50-53页
·RLS-DHP 学习控制器的设计与分析	第53-58页
·小结	第58-60页
第四章基于核的连续空间增强学习方法及应用研究	第60-73页
·基于核的连续空间增强学习方法研究	第60-63页
·核DHP 方法的理论原理	第60-62页
·核DHP 方法的收敛性分析	第62-63页
·核DHP 方法的算法实现及仿真研究	第63-68页
·核DHP 学习控制器设计	第63-65页
·学习控制结果及对比分析	第65-68页
·基于核的Cart-Pole 平衡控制问题研究	第68-72页
·核DHP 学习控制器设计	第68-70页
·学习控制结果及对比分析	第70-72页
·小结	第72-73页
第五章总结和展望	第73-76页
致谢	第76-77页
参考文献	第77-87页
作者在攻读硕士学位期间完成和发表的论文	第87-88页
附录A 论文相关结构框图	第88-90页
附录B 缩略词对照表	第90页