基于近似动态规划的优化控制方法及在自主驾驶车辆中的应用

摘要	第11-13页
ABSTRACT	第13-14页
符号列表	第15-17页
第一章绪论	第17-33页
1.1 课题研究背景与研究意义	第17-18页
1.2 增强学习与近似动态规划研究概况	第18-24页
1.2.1 基于值函数逼近的增强学习算法	第19-20页
1.2.2 基于直接策略搜索与近似策略迭代的增强学习算法	第20页
1.2.3 近似动态规划方法	第20-23页
1.2.4 增强学习与近似动态规划的应用	第23-24页
1.3 自主驾驶汽车及运动控制方法研究现状	第24-29页
1.3.1 自主驾驶汽车研究概述	第24-27页
1.3.2 自主驾驶汽车运动控制研究现状	第27-29页
1.4 研究内容及主要贡献	第29-33页
1.4.1 本文研究内容	第29-31页
1.4.2 本文主要贡献	第31-33页
第二章增强学习理论基础及基于核的近似动态规划方法	第33-60页
2.1 马尔可夫决策过程的基本概念	第33-36页
2.2 ADP方法的理论框架及原理	第36-41页
2.2.1 HDP算法	第36-38页
2.2.2 DHP算法	第38-41页
2.3 基于核的近似动态规划方法	第41-50页
2.3.1 KADP方法的统一架构	第41-44页
2.3.2 KHDP算法	第44页
2.3.3 KDHP算法	第44-46页
2.3.4 收敛性与控制性能分析	第46-50页
2.4 仿真研究	第50-56页
2.4.1 一级倒立摆控制问题	第50-55页
2.4.2 二级倒立摆控制问题	第55-56页
2.5 实验研究	第56-59页
2.5.1 一级倒立摆在线学习控制	第57-58页
2.5.2 二级倒立摆控制实验	第58-59页
2.6 本章小结	第59-60页
第三章基于图拉普拉斯的近似动态规划方法	第60-81页
3.1 流形学习与谱图理论	第60-62页
3.1.1 流形学习概述	第60-61页
3.1.2 谱图理论及构图方法	第61-62页
3.2 基于图拉普拉斯的ADP方法	第62-71页
3.2.1 GL-ADP方法的统一框架	第62-65页
3.2.2 GL-HDP算法	第65-67页
3.2.3 GL-DHP算法	第67-68页
3.2.4 计算代价与控制性能分析与讨论	第68-71页
3.3 仿真研究	第71-80页
3.3.1 CSTR控制问题	第71-75页
3.3.2 板球系统控制问题	第75-80页
3.4 本章小结	第80-81页
第四章滚动优化的近似动态规划方法	第81-105页
4.1 有限时域近似动态规划方法理论	第81-82页
4.2 滚动时域的近似动态规划方法	第82-95页
4.2.1 滚动时域增量近似动态规划方法	第82-84页
4.2.2 滚动时域迭代近似动态规划方法	第84-95页
4.3 仿真研究	第95-104页
4.3.1 滚动时域增量DHP算法的仿真研究	第95-101页
4.3.2 滚动时域迭代DHP算法的仿真研究	第101-104页
4.4 本章小结	第104-105页
第五章基于KDHP算法的自主驾驶车辆侧向控制研究	第105-133页
5.1 自主车侧向控制的MDP模型	第105-111页
5.1.1 自主车与道路模型	第106-107页
5.1.2 侧向误差模型	第107-109页
5.1.3 侧向控制问题的MDP模型	第109-111页
5.2 基于KDHP算法的自主车侧向控制器设计	第111-114页
5.3 仿真研究	第114-121页
5.3.1 变换车道	第116-118页
5.3.2 8字形跟踪	第118-119页
5.3.3 校园道路	第119-121页
5.4 实车实验	第121-132页
5.4.1 大曲率路径的侧向控制实验	第122-124页
5.4.2 校园道路的侧向控制实验	第124-127页
5.4.3 城市道路的侧向控制实验	第127-129页
5.4.4 高速公路的侧向控制实验	第129-132页
5.5 本章小结	第132-133页
第六章结论与展望	第133-135页
6.1 论文工作总结	第133-134页
6.2 对未来工作的展望	第134-135页
致谢	第135-137页
参考文献	第137-153页
作者在学期间取得的学术成果	第153-154页