智能驾驶车辆自主决策与规划的增强学习方法研究

摘要	第11-13页
ABSTRACT	第13-14页
第一章绪论	第15-33页
1.1 本文研究背景	第15-16页
1.2 增强学习研究现状	第16-20页
1.2.1 基于值函数逼近的增强学习	第17页
1.2.2 基于策略搜索的增强学习	第17-18页
1.2.3 近似动态规划方法	第18页
1.2.4 结构化增强学习	第18-19页
1.2.5 增强学习的应用推广	第19-20页
1.3 智能驾驶车辆决策与规划方法研究现状	第20-29页
1.3.1 智能驾驶车辆发展概述	第20-27页
1.3.2 智能车辆驾驶决策研究进展	第27-28页
1.3.3 智能车辆路径规划研究进展	第28-29页
1.4 论文的组织结构和主要贡献	第29-33页
1.4.1 本文的组织结构	第29-30页
1.4.2 本文的主要贡献	第30-33页
第二章大规模状态空间增强学习的随机神经元特征表示	第33-63页
2.1 增强学习理论基础	第33-41页
2.1.1 增强学习的发展历程	第33-36页
2.1.2 增强学习相关概念	第36-38页
2.1.3 马尔可夫决策过程	第38-40页
2.1.4 TD学习理论	第40-41页
2.2 近似策略迭代与常用特征表示方法	第41-43页
2.2.1 近似策略迭代方法概述	第41-42页
2.2.2 值函数逼近中的常用特征表示方法	第42-43页
2.3 基于随机神经元的近似策略迭代方法	第43-50页
2.3.1 超限学习机概述	第43-44页
2.3.2 基于随机神经元的近似策略迭代方法	第44-47页
2.3.3 算法性能分析	第47-50页
2.4 仿真研究	第50-62页
2.4.1 Mountain-car学习控制问题仿真研究	第50-55页
2.4.2 一阶倒立摆学习控制问题仿真研究	第55-61页
2.4.3 分析讨论	第61-62页
2.5 本章小结	第62-63页
第三章动态车流条件下智能车辆驾驶决策的增强学习方法	第63-91页
3.1 动态车流条件下的驾驶决策问题	第63-67页
3.1.1 高速公路环境概述	第63-64页
3.1.2 动态车流中的超车决策问题	第64-66页
3.1.3 智能车辆驾驶决策相关工作	第66-67页
3.2 高速公路驾驶决策仿真环境概述	第67-77页
3.2.1 车辆驱动-制动模型	第68-69页
3.2.2 车辆转向模型	第69-70页
3.2.3 车体动力学模型	第70-77页
3.3 动态车流中的驾驶决策问题MDP建模	第77-79页
3.3.1 状态定义	第78页
3.3.2 动作定义	第78-79页
3.3.3 回报函数	第79页
3.4 动态车流条件下智能车辆驾驶决策的增强学习方法	第79-84页
3.4.1 智能车辆驾驶决策增强学习方法框架	第79-81页
3.4.2 基于KLSPI的智能驾驶决策算法	第81-84页
3.5 动态车流中的驾驶决策仿真研究	第84-89页
3.5.1 仿真环境离线采样	第84-85页
3.5.2 基于KLSPI的驾驶决策仿真研究	第85-89页
3.6 本章小结	第89-91页
第四章基于增强学习的智能车辆分层路径规划方法	第91-107页
4.1 智能车辆路径规划概述	第91-93页
4.1.1 路径规划问题	第91-92页
4.1.2 相关工作	第92-93页
4.2 基于采样的RRT-Connect规划方法简介	第93-95页
4.3 基于增强学习的分层路径规划方法	第95-101页
4.3.1 基于增强学习的分层路径规划框架	第95-97页
4.3.2 基于LSPI的路径优化器	第97-100页
4.3.3 A*-LSPI分层路径规划算法	第100-101页
4.4 路径规划仿真研究	第101-106页
4.5 本章小结	第106-107页
第五章基于增强学习的智能车高速公路自主驾驶决策系统	第107-119页
5.1 自主驾驶决策实验平台	第107-110页
5.1.1 硬件配置	第107-108页
5.1.2 系统结构	第108-110页
5.2 基于增强学习的自主驾驶决策系统	第110-111页
5.3 动态车流中的自主驾驶决策实验	第111-118页
5.3.1 实验场景介绍	第111-112页
5.3.2 实验结果与分析讨论	第112-118页
5.4 本章小结	第118-119页
第六章总结与展望	第119-123页
6.1 论文工作总结	第119-120页
6.2 展望	第120-123页
致谢	第123-125页
参考文献	第125-141页
作者在学期间取得的学术成果	第141-142页