首页--交通运输论文--水路运输论文--各种船舶论文--船舶:按航行状态分论文--潜水船论文

基于分层强化学习的AUV路径规划方法研究

摘要第5-6页
abstract第6-7页
第1章 绪论第11-19页
    1.1 AUV路径规划的背景和意义第11页
    1.2 路径规划技术概述第11-13页
    1.3 研究现状第13-16页
    1.4 面临的问题和解决方案第16页
    1.5 本文研究内容第16-19页
第2章 基于强化学习的AUV路径规划分层结构设计第19-31页
    2.1 引言第19页
    2.2 强化学习理论基础第19-23页
        2.2.1 强化学习思想第19-21页
        2.2.2 马尔可夫决策第21-22页
        2.2.3 Q-学习算法第22-23页
    2.3 分层强化学习理论第23-26页
        2.3.1 半马尔可夫决策过程第24页
        2.3.2 分层与抽象第24-25页
        2.3.3 MAXQ学习方法第25-26页
    2.4 AUV路径规划分层框架设计第26-30页
        2.4.1 分层原则第27-28页
        2.4.2 分层决策策略第28页
        2.4.4 三个层次设计第28-30页
    2.5 本章小结第30-31页
第3章 基于半马尔可夫决策过程的AUV全局路径规划第31-49页
    3.1 引言第31页
    3.2 AUV全局路径规划算法研究第31-34页
        3.2.1 搜索策略第31-32页
        3.2.2 MAXQ任务分层第32-33页
        3.2.3 基于MAXQ算法的评价函数第33-34页
    3.3 AUV全局路径规划模型设计第34-39页
        3.3.1 环境状态模型第35页
        3.3.2 行为动作模型第35-36页
        3.3.3 奖赏函数模型第36页
        3.3.4 状态转移函数模型第36-37页
        3.3.5 分层结构模型第37-39页
    3.4 AUV全局路径规划仿真界面第39-42页
    3.5 AUV全局路径规划仿真试验第42-48页
        3.5.1 仿真试验算法流程第42-43页
        3.5.2 路径优化设计第43-45页
        3.5.3 仿真试验第45-48页
    3.6 本章小结第48-49页
第4章 基于分层强化学习的AUV局部路径规划第49-69页
    4.1 引言第49页
    4.2 AUV局部路径规划系统建模第49-57页
        4.2.1 分层模型第49-51页
        4.2.2 机器人传感器模型第51-54页
        4.2.3 环境状态模型第54-55页
        4.2.4 行为动作模型第55页
        4.2.5 海流模型第55-56页
        4.2.6 层次强化信号模型第56-57页
    4.3 AUV局部路径规划算法研究第57-61页
        4.3.1 CMAC神经网络原理第57-58页
        4.3.2 基于CMAC的MAXQ算法改进第58-60页
        4.3.3 AUV局部路径规划算法流程第60-61页
    4.4 基于分层强化学习的实时路径规划仿真第61-63页
    4.5 不完全探测下的路径规划仿真第63-67页
        4.5.1 AUV传感器故障简介第63-64页
        4.5.2 传感器故障下的避障机制第64-66页
        4.5.3 仿真试验第66-67页
    4.6 本章小结第67-69页
结论第69-71页
参考文献第71-75页
攻读硕士学位期间发表的论文和取得的科研成果第75-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:飞翼式水下滑翔机垂直面运动控制技术研究
下一篇:Ni-P/Al2O3/石墨烯电刷镀层的制备及其摩擦学性能研究