首页--数理科学和化学论文--运筹学论文--规划论(数学规划)论文--动态规划论文

基于近似动态规划的优化控制方法及在自主驾驶车辆中的应用

摘要第11-13页
ABSTRACT第13-14页
符号列表第15-17页
第一章 绪论第17-33页
    1.1 课题研究背景与研究意义第17-18页
    1.2 增强学习与近似动态规划研究概况第18-24页
        1.2.1 基于值函数逼近的增强学习算法第19-20页
        1.2.2 基于直接策略搜索与近似策略迭代的增强学习算法第20页
        1.2.3 近似动态规划方法第20-23页
        1.2.4 增强学习与近似动态规划的应用第23-24页
    1.3 自主驾驶汽车及运动控制方法研究现状第24-29页
        1.3.1 自主驾驶汽车研究概述第24-27页
        1.3.2 自主驾驶汽车运动控制研究现状第27-29页
    1.4 研究内容及主要贡献第29-33页
        1.4.1 本文研究内容第29-31页
        1.4.2 本文主要贡献第31-33页
第二章 增强学习理论基础及基于核的近似动态规划方法第33-60页
    2.1 马尔可夫决策过程的基本概念第33-36页
    2.2 ADP方法的理论框架及原理第36-41页
        2.2.1 HDP算法第36-38页
        2.2.2 DHP算法第38-41页
    2.3 基于核的近似动态规划方法第41-50页
        2.3.1 KADP方法的统一架构第41-44页
        2.3.2 KHDP算法第44页
        2.3.3 KDHP算法第44-46页
        2.3.4 收敛性与控制性能分析第46-50页
    2.4 仿真研究第50-56页
        2.4.1 一级倒立摆控制问题第50-55页
        2.4.2 二级倒立摆控制问题第55-56页
    2.5 实验研究第56-59页
        2.5.1 一级倒立摆在线学习控制第57-58页
        2.5.2 二级倒立摆控制实验第58-59页
    2.6 本章小结第59-60页
第三章 基于图拉普拉斯的近似动态规划方法第60-81页
    3.1 流形学习与谱图理论第60-62页
        3.1.1 流形学习概述第60-61页
        3.1.2 谱图理论及构图方法第61-62页
    3.2 基于图拉普拉斯的ADP方法第62-71页
        3.2.1 GL-ADP方法的统一框架第62-65页
        3.2.2 GL-HDP算法第65-67页
        3.2.3 GL-DHP算法第67-68页
        3.2.4 计算代价与控制性能分析与讨论第68-71页
    3.3 仿真研究第71-80页
        3.3.1 CSTR控制问题第71-75页
        3.3.2 板球系统控制问题第75-80页
    3.4 本章小结第80-81页
第四章 滚动优化的近似动态规划方法第81-105页
    4.1 有限时域近似动态规划方法理论第81-82页
    4.2 滚动时域的近似动态规划方法第82-95页
        4.2.1 滚动时域增量近似动态规划方法第82-84页
        4.2.2 滚动时域迭代近似动态规划方法第84-95页
    4.3 仿真研究第95-104页
        4.3.1 滚动时域增量DHP算法的仿真研究第95-101页
        4.3.2 滚动时域迭代DHP算法的仿真研究第101-104页
    4.4 本章小结第104-105页
第五章 基于KDHP算法的自主驾驶车辆侧向控制研究第105-133页
    5.1 自主车侧向控制的MDP模型第105-111页
        5.1.1 自主车与道路模型第106-107页
        5.1.2 侧向误差模型第107-109页
        5.1.3 侧向控制问题的MDP模型第109-111页
    5.2 基于KDHP算法的自主车侧向控制器设计第111-114页
    5.3 仿真研究第114-121页
        5.3.1 变换车道第116-118页
        5.3.2 8字形跟踪第118-119页
        5.3.3 校园道路第119-121页
    5.4 实车实验第121-132页
        5.4.1 大曲率路径的侧向控制实验第122-124页
        5.4.2 校园道路的侧向控制实验第124-127页
        5.4.3 城市道路的侧向控制实验第127-129页
        5.4.4 高速公路的侧向控制实验第129-132页
    5.5 本章小结第132-133页
第六章 结论与展望第133-135页
    6.1 论文工作总结第133-134页
    6.2 对未来工作的展望第134-135页
致谢第135-137页
参考文献第137-153页
作者在学期间取得的学术成果第153-154页

论文共154页,点击 下载论文
上一篇:基于FDM彩色3D打印机结构设计及关键零部件有限元分析
下一篇:基于量子测量反馈控制的纠缠态制备与纠缠态应用研究