基于强化学习的汽车协同式自适应巡航控制技术研究

摘要	第4-6页
abstract	第6-7页
第1章绪论	第10-14页
1.1 研究背景及意义	第10-11页
1.2 协同式自适应巡航控制研究现状	第11-12页
1.3 本文研究内容和结构安排	第12-14页
第2章基于Q-Learning的CACC技术	第14-26页
2.1 马尔科夫决策过程	第14-15页
2.2 时间差分法	第15-16页
2.3 基于Q-Learning的CACC跟驰控制	第16-26页
2.3.1 CACC跟驰控制Q-Learning算法	第16-17页
2.3.2 状态、动作和回报函数定义	第17-19页
2.3.3 启发式ε-贪婪动作选择策略	第19-20页
2.3.4 跟驰控制算法学习过程	第20-23页
2.3.5 跟驰控制算法执行过程	第23-26页
第3章基于DeepQ-Learning的CACC技术	第26-37页
3.1 Q-Learning学习的局限	第26页
3.2 值函数逼近法	第26-27页
3.3 神经网络逼近值函数	第27页
3.3.1 神经网络	第27页
3.3.2 万能逼近定理	第27页
3.4 神经网络与Q-Learning	第27-29页
3.5 基于DeepQ-Learning的CACC跟驰控制	第29-37页
3.5.1 状态、动作、回报函数定义和动作选择	第29-31页
3.5.2 网络结构及模型设计	第31-32页
3.5.3 跟驰控制算法学习过程	第32-35页
3.5.4 跟驰控制算法执行过程	第35-37页
第4章对比实验	第37-50页
4.1 实验初始设置	第37页
4.2 训练数据集生成	第37-39页
4.3 实验结果对比	第39-50页
4.3.1 匀速跟车工况	第39-43页
4.3.2 走-停工况	第43-46页
4.3.3 紧急刹车工况	第46-49页
4.3.4 结论	第49-50页
第5章总结与展望	第50-52页
参考文献	第52-55页
作者简介及科研成果	第55-56页
致谢	第56页