主要英文缩略语的中英文对照表 | 第11-12页 |
摘要 | 第12-14页 |
Abstract | 第14-15页 |
第一章 绪论 | 第16-33页 |
1.1 研究背景 | 第16-17页 |
1.2 高速公路自主驾驶的研究进展 | 第17-21页 |
1.2.1 高速公路自主驾驶的研究现状 | 第18-20页 |
1.2.2 高速公路自主驾驶的关键技术 | 第20-21页 |
1.3 车辆动力学仿真建模的研究进展 | 第21-23页 |
1.3.1 集中参数仿真模型 | 第21-23页 |
1.3.2 多体参数仿真模型 | 第23页 |
1.4 增强学习的研究进展 | 第23-29页 |
1.4.1 典型增强学习方法 | 第25-26页 |
1.4.2 面向连续空间的增强学习方法 | 第26-28页 |
1.4.3 结构化增强学习方法 | 第28页 |
1.4.4 多目标增强学习方法 | 第28-29页 |
1.5 本文的主要研究内容、组织结构和主要贡献 | 第29-33页 |
1.5.1 本文的主要研究内容和组织结构 | 第30-31页 |
1.5.2 论文的主要成果和贡献 | 第31-33页 |
第二章 基于连续空间的增强学习方法研究 | 第33-60页 |
2.1 MDP和RL方法 | 第33-40页 |
2.1.1 MDP | 第33-36页 |
2.1.2 RL方法 | 第36-38页 |
2.1.3 API方法 | 第38-40页 |
2.2 针对连续状态空间的改进KLSPI算法 | 第40-54页 |
2.2.1 基于改进核稀疏化过程的离线KLSPI算法 | 第40-51页 |
2.2.2 基于主动采样的在线KLSPI算法 | 第51-54页 |
2.3 针对连续行为空间的改进API算法 | 第54-59页 |
2.3.1 CAPI算法中的基函数 | 第54页 |
2.3.2 CAPI算法中的快速策略搜索 | 第54-55页 |
2.3.3 CAPI算法中的基函数自适应筛选方法 | 第55-57页 |
2.3.4 仿真测试 | 第57-59页 |
2.4 小结 | 第59-60页 |
第三章 基于二叉树的HAPI和基于序贯加权和的MORL | 第60-82页 |
3.1 基于二叉树MDP分解的HAPI方法 | 第60-73页 |
3.1.1 基于二叉树的MDP分解方法 | 第60-64页 |
3.1.2 HAPI算法 | 第64-66页 |
3.1.3 HAPI算法的性能分析 | 第66-69页 |
3.1.4 HAPI算法的性能测试 | 第69-73页 |
3.2 基于序贯加权和MORL方法 | 第73-80页 |
3.2.1 求解MORL问题的基本框架 | 第73-75页 |
3.2.2 基于加权和MORL算法 | 第75-76页 |
3.2.3 基于序贯MORL算法 | 第76-77页 |
3.2.4 基于序贯加权和MORL算法 | 第77-78页 |
3.2.5 算法性能测试 | 第78-80页 |
3.3 小结 | 第80-82页 |
第四章 高速公路环境中的车辆动力学仿真建模 | 第82-111页 |
4.1 仿真建模思路 | 第82-84页 |
4.2 转向模型 | 第84-86页 |
4.2.1 转向传动比 | 第84页 |
4.2.2 转向轮的协调转角 | 第84-86页 |
4.3 车体动力学模型 | 第86-97页 |
4.3.1 坐标变换 | 第86-88页 |
4.3.2 道路模型 | 第88-89页 |
4.3.3 轮胎模型 | 第89-92页 |
4.3.4 车身与悬架模型 | 第92-96页 |
4.3.5 道路坐标系的更新 | 第96-97页 |
4.4 驱动-制动模型 | 第97-101页 |
4.4.1 驱动系统建模 | 第97-100页 |
4.4.2 制动系统建模 | 第100-101页 |
4.5 仿真模型验证 | 第101-110页 |
4.5.1 纵向动态响应模型验证 | 第102-105页 |
4.5.2 侧向动态响应模型验证 | 第105-108页 |
4.5.3 特征值选取与模型精度 | 第108-110页 |
4.6 小结 | 第110-111页 |
第五章 高速公路环境中汇入车流时的最短安全距离 | 第111-135页 |
5.1 高速公路环境模型 | 第111-113页 |
5.2 自主车的控制器设计 | 第113-121页 |
5.2.1 基于扰动观测的纵向速度控制 | 第114-118页 |
5.2.2 基于圆弧追踪的路径跟踪控制 | 第118-121页 |
5.3 自主车的规划器设计 | 第121-123页 |
5.3.1 纵向速度规划 | 第121-122页 |
5.3.2 路径规划 | 第122-123页 |
5.4 自主车汇入车流时的最短安全距离 | 第123-134页 |
5.4.1 汇入车流过程中的安全性分析 | 第123-124页 |
5.4.2 最短安全距离的仿真结果 | 第124-134页 |
5.5 小结 | 第134-135页 |
第六章 基于增强学习的高速公路自主驾驶 | 第135-153页 |
6.1 基于CAPI算法的自主车纵向速度控制 | 第135-143页 |
6.1.1 纵向速度学习控制的MDP建模 | 第136页 |
6.1.2 纵向速度学习控制的仿真测试 | 第136-143页 |
6.2 基于增强学习的自主驾驶决策 | 第143-152页 |
6.2.1 自主驾驶过程的MDP建模 | 第143-145页 |
6.2.2 自主驾驶策略的仿真求解 | 第145-146页 |
6.2.3 自主驾驶策略的性能评估 | 第146-152页 |
6.3 小结 | 第152-153页 |
第七章 总结与展望 | 第153-156页 |
7.1 论文工作总结 | 第153-154页 |
7.2 进一步研究展望 | 第154-156页 |
致谢 | 第156-158页 |
参考文献 | 第158-168页 |
作者在学期间取得的学术成果 | 第168-169页 |