首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

多移动机器人运动控制策略的强化学习研究

1 绪论第1-21页
   ·多机器人系统的研究概述第11-12页
   ·多移动机器人环境中的运动控制研究概述第12-14页
   ·强化学习的研究与应用概述第14-19页
     ·强化学习方法第14-18页
       ·马尔可夫决策过程(Markov Decision Process)第14-16页
       ·强化学习中策略的评价第16页
       ·强化学习的要素第16-17页
       ·强化学习的过程第17-18页
     ·强化学习的研究进展第18-19页
   ·本论文的主要工作第19-21页
2 动态环境中的模糊建模和规划及运动控制策略强化学习第21-33页
   ·本章概述第21页
   ·动态环境中基于模糊概念的环境建模和运动控制第21-26页
     ·基于模糊集合的环境建模第22-24页
     ·基于模糊环境模型的方向决策第24-25页
     ·运动控制的流程和计算机仿真实验结果及分析第25-26页
   ·动态环境中基于强化学习的运动控制策略自学习第26-30页
     ·使用模式增强网络估计决策参数第26-29页
     ·运动控制策略学习过程第29页
     ·计算机仿真实验结果及分析第29-30页
   ·本章结论第30-33页
3 基于模糊状态的强化学习算法第33-51页
   ·本章概述第33页
   ·基于模糊状态的强化学习算法第33-36页
     ·模糊概念和模糊状态第34-35页
     ·模糊状态对学习性能的改进第35页
     ·机器人二维工作空间中的模糊状态的定义第35-36页
   ·多障碍环境中基于FSRL的路径规划第36-42页
     ·多障碍环境中路径规划的马尔可夫决策过程模型第37页
     ·基于FSRL的路径规划与人工势场方法第37-38页
     ·自学习路径规划第38-39页
     ·计算机仿真实验结果及分析第39-42页
   ·基于蚁群优化算法的多障碍环境中的路径优化规划第42-50页
     ·蚁群优化算法第42-43页
     ·基于人工势场初始化和蚁群算法的路径优化规划第43-45页
       ·初始解对蚁群算法性能的影响第43-44页
       ·基于人工势场的路径强度初始化第44-45页
       ·基于蚁群算法的势场优化和路径规划第45页
     ·计算机仿真实验及结果分析第45-50页
       ·基于蚁群算法的优化规划和人工势场法的实验结果比较第47-48页
       ·人工势场作为先验知识对路径优化效率的提高第48-50页
   ·本章结论第50-51页
4 基于学习尺度的改进强化学习算法第51-65页
   ·本章概述第51页
   ·基于模糊状态的多尺度强化学习第51-57页
     ·强化学习的学习尺度第51-52页
     ·基于模糊状态的离散状态空间中的学习尺度第52页
     ·不同学习尺度下强化学习的性能第52-55页
     ·基于模糊状态的多尺度强化学习第55-57页
   ·蚁群强化学习算法及延迟优化强化学习第57-64页
     ·蚁群强化学习算法第57-60页
     ·延迟优化强化学习算法第60-64页
   ·本章结论第64-65页
5 强化学习中的决策熵和状态熵第65-78页
   ·本章概述第65-66页
   ·离散状态空间中的决策熵第66-69页
     ·随机变量的熵第66页
     ·局部决策熵和全局决策熵第66-67页
     ·全局决策熵作为学习过程中策略收敛程度的度量第67-69页
   ·基于决策熵的自适应学习率调整第69-74页
     ·不同学习率下的学习性能第69-70页
     ·基于决策熵的自适应学习率第70-72页
     ·基于局部决策熵的自适应学习率强化学习算法第72-74页
   ·强化学习中度量观测状态信息不完整性的状态熵第74-76页
     ·强化学习中观测信息的不完整性第74-75页
     ·强化学习中观测状态的先验状态熵和后验状态熵第75-76页
   ·本章结论第76-78页
6 基于TeamBots仿真实验平台的多移动机器人控制策略学习第78-91页
   ·本章概述第78页
   ·TeamBots多移动机器人仿真实验平台简介第78-79页
   ·多机器人目标搜索任务的策略学习第79-84页
     ·目标搜索任务简介第79页
     ·机器人目标搜索的控制行为设计第79-80页
     ·机器人目标搜索策略的变学习率强化学习第80-82页
     ·多机器人目标搜索实验及结果分析第82-84页
   ·机器人足球任务的策略学习第84-90页
     ·足球机器人简介第84页
     ·SoccerBots足球机器人仿真平台第84-85页
     ·足球机器人的控制行为设计第85-87页
     ·足球机器人控制策略的变学习率强化学习第87-90页
   ·本章结论第90-91页
7 总结与展望第91-93页
致谢第93-94页
参考文献第94-100页
附录:博士研究生阶段所发表的论文第100页

论文共100页,点击 下载论文
上一篇:意外义语气副词“幸亏”、“偏偏”、“竟然”比较研究
下一篇:关于环境犯罪刑事立法的几点思考