JZJ站位间转运策略强化学习方法研究与实现

致谢	第5-6页
摘要	第6-7页
ABSTRACT	第7-8页
1 引言	第11-17页
1.1 选题的研究背景及目的	第11-12页
1.2 国内外研究现状	第12-13页
1.3 JZJ站位间转运活动分析	第13-14页
1.4 研究目标和内容	第14-15页
1.5 论文组织结构	第15-17页
2 相关理论知识介绍	第17-29页
2.1 强化学习方法概述	第17-24页
2.2 JZJ模型	第24-26页
2.3 甲板环境场景	第26-28页
2.4 本章小结	第28-29页
3 基于深度强化学习的站位间转运策略算法	第29-41页
3.1 问题建模	第29-31页
3.1.1 场景建模	第29-30页
3.1.2 运动学模型	第30-31页
3.2 概念介绍	第31-32页
3.3 解决思路	第32-37页
3.3.1 动态栅格先直后曲法	第32-34页
3.3.2 基于贝塞尔曲线的随机游走	第34-36页
3.3.3 角度区间内的随机游走	第36-37页
3.4 转运策略评价	第37-40页
3.4.1 评价因素	第37-38页
3.4.2 归一化	第38-39页
3.4.3 评价函数	第39-40页
3.5 本章小结	第40-41页
4 系统设计与实现	第41-67页
4.1 实验环境	第41页
4.2 系统结构	第41-42页
4.3 强化学习环境	第42-45页
4.3.1 二维场景建模工具	第42-44页
4.3.2 路径可视化评价工具	第44-45页
4.4 仿真演示环境	第45页
4.5 研究方法实现	第45-61页
4.5.1 动态栅格先直后曲法	第45-53页
4.5.2 基于贝塞尔曲线的随机游走	第53页
4.5.3 角度区间内随机游走	第53-61页
4.6 实验过程与数据	第61-66页
4.6.1 算法训练效率	第61-63页
4.6.2 算法结果展示与评价	第63-66页
4.7 本章小结	第66-67页
5 结论	第67-69页
5.1 论文总结	第67页
5.2 研究展望	第67-69页
参考文献	第69-71页
作者简历及攻读硕士/博士学位期间取得的研究成果	第71-73页
学位论文数据集	第73页