首页--交通运输论文--公路运输论文--汽车工程论文--汽车结构部件论文--电气设备及附件论文

基于深度强化学习的无人车控制策略研究

摘要第4-5页
Abstract第5页
第1章 绪论第8-15页
    1.1 课题研究背景及意义第8-9页
    1.2 国内外研究现状第9-14页
        1.2.1 无人驾驶技术的国内外研究现状第9-11页
        1.2.2 深度强化学习的国内外研究现状第11-13页
        1.2.3 深度强化学习在无人驾驶中的应用第13-14页
    1.3 课题研究的主要内容第14-15页
第2章 无人车控制策略理论基础第15-27页
    2.1 深度强化学习原理第15-21页
        2.1.1 强化学习数学基础第15-16页
        2.1.2 强化学习求解方法第16-18页
        2.1.3 深度学习网络结构与训练模型第18-21页
    2.2 深度强化学习算法研究第21-23页
        2.2.1 基于值函数的深度强化学习第21-22页
        2.2.2 基于策略梯度的深度强化学习第22-23页
    2.3 深度确定性策略梯度(DDPG)算法框架第23-26页
    2.4 本章小结第26-27页
第3章 CEC-DDPG算法设计第27-42页
    3.1 基于经验分类指导的确定性策略梯度(CEC-DDPG)算法第27-28页
    3.2 经验分类存放机制第28-34页
    3.3 随机指挥家网络第34-35页
    3.4 网络训练与参数更新第35-39页
    3.5 算法描述第39-41页
    3.6 本章小结第41-42页
第4章 无人车仿真系统建模与调试第42-51页
    4.1 无人车仿真系统建模第42-46页
        4.1.1 仿真环境搭建第42-44页
        4.1.2 仿真环境的状态信息和控制动作第44-45页
        4.1.3 仿真系统框架设计第45-46页
    4.2 无人车控制策略模型实现第46-50页
        4.2.1 DDPG建模分析第46-47页
        4.2.2 CEC-DDPG建模分析第47-48页
        4.2.3 网络模型实验调试第48-50页
    4.3 本章小结第50-51页
第5章 无人车控制策略仿真验证第51-67页
    5.1 软硬件环境搭建第51-52页
        5.1.1 实验环境配置第51页
        5.1.2 CEC-DDPG算法超参数设计第51-52页
    5.2 奖励函数设计第52-57页
    5.3 最优采样比第57-59页
    5.4 最终仿真实验效果第59-66页
        5.4.1 策略学习速度第60-63页
        5.4.2 跟踪误差表现第63-66页
        5.4.3 控制策略的泛化性能第66页
    5.5 本章小结第66-67页
结论第67-68页
参考文献第68-72页
致谢第72页

论文共72页,点击 下载论文
上一篇:外国中小学校园欺凌问题及治理对策研究
下一篇:基于语文核心素养的高中古诗词教学研究