首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于分层强化学习的MAUVS围捕策略研究

摘要第6-7页
abstract第7-8页
第1章 绪论第11-17页
    1.1 课题研究背景及意义第11-12页
    1.2 多机器人围捕研究现状第12-14页
    1.3 研究内容及创新第14页
    1.4 论文组织结构第14-17页
第2章 MAUVS围捕方法设计第17-31页
    2.1 MAUVS避障方法第17-18页
    2.2 围捕任务描述第18-20页
    2.3 目标者逃跑方法第20-21页
    2.4 面向动态围捕的MAUVS任务分配方法设计第21-30页
        2.4.1 基于角色及能力约束的动态伏击任务分配第22-25页
        2.4.2 基于角色及能力约束的动态拦截追捕任务分配第25-26页
        2.4.3 基于角色及能力约束的动态围捕任务分配总方法第26-30页
    2.5 本章小结第30-31页
第3章 基于分层强化学习的围捕方法第31-63页
    3.1 基于S-MAXQ自主分层算法设计第31-37页
        3.1.1 MAXQ理论基础及改进第32-34页
        3.1.2 S-MAXQ学习算法及分析第34-37页
    3.2 S-MAXQ仿真实验及算法分析第37-43页
        3.2.1 实验参数设置第38-39页
        3.2.2 无规则障碍物环境下避障导航第39-40页
        3.2.3 复杂墙角环境下的避障导航第40页
        3.2.4 分层结果说明第40-43页
    3.3 基于SP-MAXQ的MAUVS分层强化学习围捕方法第43-54页
        3.3.1 MAUVS的SMDP模型设计第43-44页
        3.3.2 SP-MAXQ理论基础第44-46页
        3.3.3 基于SP-MAXQ算法的围捕策略分析第46-54页
    3.4 SP-MAXQ仿真实验及算法分析第54-61页
        3.4.1 实验参数设置第54页
        3.4.2 复杂障碍物围捕仿真实验第54-56页
        3.4.3 无障碍物围捕仿真实验第56-59页
        3.4.4 三种对比算法围捕过程中matlab性能分析第59-61页
    3.5 本章小结第61-63页
第4章 基于多Pioneer3-DX移动机器人的围捕实验第63-79页
    4.1 Pioneer3-DX移动机器人系统概述第63-65页
    4.2 参数设置第65-66页
        4.2.1 Pioneer3-DX程序参数设置第65-66页
        4.2.2 围捕参数设置第66页
    4.3 多Pioneer3-DX移动机器人围捕系统调试第66-78页
        4.3.1 实体Pioneer3-DX测试使用第66-69页
        4.3.2 Mapper3绘图软件第69-71页
        4.3.3 MobileEyes(远程界面GUI)第71-72页
        4.3.4 MobileSim运动仿真平台第72页
        4.3.5 Aria控制台程序和ARNetworking通信接口库第72-73页
        4.3.6 ARNL高精度室内激光定位库第73页
        4.3.7 软件调用关系第73-74页
        4.3.8 多Pioneer3-DX移动机器人围捕实验结果第74-78页
    4.4 本章小结第78-79页
总结第79-81页
参考文献第81-87页
攻读硕士学位期间发表的论文和取得的科研成果第87-89页
致谢第89页

论文共89页,点击 下载论文
上一篇:铈铝复合载体镍基催化剂的一氧化碳甲烷化反应研究
下一篇:静电纺丝法制备高性能过渡金属氧化物及碳基材料储钠负极的研究