首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于强化学习的磁导航AGV控制方法研究

摘要第5-6页
Abstract第6-7页
第一章 绪论第10-15页
    1.1 研究背景与意义第10-11页
    1.2 路径跟踪控制算法研究方向与现状第11-12页
    1.3 强化学习算法研究现状第12-13页
    1.4 免模型深度强化学习研究进展第13-14页
    1.5 论文章节内容安排第14-15页
第二章 叉车式AGV系统建模第15-23页
    2.1 AGV导航方式介绍第15-16页
    2.2 AGV运动学建模第16-18页
    2.3 AGV动力学建模第18-20页
    2.4 系统约束条件第20-21页
    2.5 Serret-Frenet坐标系下的磁导航AGV路径跟踪问题第21-22页
        2.5.1 路径跟踪与轨迹跟踪第21页
        2.5.2 Serret-Frenet跟踪偏差计算第21-22页
    2.6 本章小结第22-23页
第三章 强化学习路径跟踪控制算法设计第23-35页
    3.1 强化学习基础介绍第23-24页
        3.1.1 马尔可夫决策过程第23-24页
        3.1.2 强化学习理论基础第24页
    3.2 磁导航AGV路径跟踪问题马尔可夫建模第24-27页
        3.2.1 状态空间的设计第25-26页
        3.2.2 动作空间的设计第26页
        3.2.3 奖励函数的设计第26-27页
    3.3 强化学习路径跟踪控制算法设计第27-34页
        3.3.1 Actor-Critic第28-29页
        3.3.2 Critic参数更新算法第29-31页
        3.3.3 Actor参数更新算法第31-32页
        3.3.4 算法流程介绍第32-34页
    3.4 本章小结第34-35页
第四章 路径跟踪控制算法的深度学习实现第35-48页
    4.1 深度学习技术第35-36页
        4.1.1 深度神经网络第35-36页
        4.1.2 神经网络参数更新方法第36页
    4.2 控制算法的深度神经网络实现第36-42页
        4.2.1 逼近函数的网络结构设计第37-38页
        4.2.2 目标网络及软更新第38-39页
        4.2.3 状态输入批标准化第39页
        4.2.4 经验重放缓存池第39-40页
        4.2.5 探索噪音第40页
        4.2.6 正则化方法第40-42页
    4.3 算法执行流程第42-43页
    4.4 仿真结果与分析第43-47页
    4.5 本章小结第47-48页
第五章 基于状态表示学习的算法训练加速第48-61页
    5.1 表示学习第48-52页
        5.1.1 几种通用的先验原则第48-50页
        5.1.2 表示学习相关实现算法第50-52页
    5.2 状态表示学习第52-53页
        5.2.1 状态任务解耦学习第53页
    5.3 状态表示学习的算法实现第53-56页
        5.3.1 基于自编码器的状态表示学习算法实现第54-55页
        5.3.2 自编码器训练方法第55-56页
        5.3.3 自编码器应用方法第56页
    5.4 仿真结果与分析第56-60页
    5.5 本章小结第60-61页
第六章 总结与展望第61-63页
    6.1 工作总结第61-62页
    6.2 未来展望第62-63页
致谢第63-64页
参考文献第64-70页
附录第70-71页
详细摘要第71-72页

论文共72页,点击 下载论文
上一篇:基于智能视觉引导与RFID导航的AGV设计
下一篇:基于CANopen通信的嵌入式数控系统人机接口的研究