基于增强学习的无人车辆智能决策方法研究
【摘要】:近年来随着车辆在世界范围内的普及,在给人们的生活带来方便的同时,交通事故的频发也随之成为一个亟需解决的问题,辅助驾驶系统的研究需求迫在眉睫。高速公路作为重特大交通事故的频发地,建立基于高速公路环境的驾驶辅助系统意义重大,由于车辆和环境模型的复杂性以及环境的未知性,在先验知识较少的情况下,可以依据环境信息得出正确的决策的自主车辆成为当前研究的热点。本文研究了基于增强学习的车辆智能驾驶决策方法,重点针对车辆驾驶行为的多目标决策问题进行了研究,并且探讨了驾驶行为决策系统与车辆运动控制性能优化的关系,取得了如下成果:1、在HQ3实车模型的基础上,建立了高速公路环境模型,搭建了仿真平台。通过仿真平台可以实时模拟高速公路条件下的车流环境,为了增加系统的适用性,在系统中还依据实际驾驶情形加入了一定的不确定性,为车辆智能驾驶决策的仿真以及后续其他相关研究做好了准备。2、针对车辆智能驾驶的实际问题,提出了两种基于增强学习的车辆智能驾驶方法,其中包括基于Q学习的车辆智能驾驶方法和基于最小二乘策略迭代(LSPI)的车辆智能驾驶方法,通过在仿真平台上的模拟,对这2种方法进行了验证,表明了方法的有效性。3、针对车辆驾驶性能的多目标问题,提出了基于LSPI的多目标增强学习(MORL)算法,并且应用于车辆智能驾驶决策问题中。通过在仿真平台上的模拟,验证了方法的适用性。同时,在不需要重新学习的情况下,简单改变决策系统中的决策部分,就可以得到针对不同偏好的决策,提高了方法的实用性。4、结合14自由度HQ3自主车动力学模型,设计了基于LSPI-PD的车辆侧向控制优化算法,以改善车辆的侧向跟踪性能。在侧向运动控制性能优化的基础上,研究了结合车辆运动控制性能优化的驾驶行为决策,通过仿真结果分析,显示了侧向运动控制器的学习优化能够提高驾驶行为决策的适应性。
【关键词】:自主车辆 增强学习 驾驶决策 多目标决策、侧向跟踪
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP301.6