首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于模拟退火-Q学习的移动机器人路径规划技术研究

摘要第1-4页
Abstract第4-8页
1 绪论第8-14页
   ·研究背景和意义第8页
   ·移动机器人路径规划方法第8-10页
     ·基于环境模型的全局路径规划方法第9页
     ·基于传感器信息的局部路径规划方法第9-10页
     ·基于行为的路径规划方法第10页
   ·强化学习的研究现状及其在路径规划中的应用第10-13页
     ·强化学习的研究现状第10-11页
     ·强化学习在路径规划中的应用第11-12页
     ·强化学习在路径规划中的关键问题第12-13页
   ·本文主要工作和内容安排第13-14页
2 强化学习理论第14-22页
   ·强化学习的基本模型第14-15页
   ·强化学习的结构模型第15-19页
     ·强化学习的内部结构第15-16页
     ·强化学习模块介绍第16-17页
     ·强化学习模块的实现方法第17-19页
   ·强化学习的典型算法第19-21页
     ·马尔可夫决策过程第19页
     ·动态规划方法第19页
     ·蒙特卡罗方法第19-20页
     ·TD算法第20页
     ·O学习算法第20-21页
     ·Sarsa算法第21页
   ·本章小结第21-22页
3 基于行为分解奖赏函数的SA-Q学习移动机器人路径规划第22-38页
   ·模拟退火算法第22-24页
     ·模拟退火中的Metropolis准则第22-23页
     ·模拟退火算法描述第23-24页
   ·SA-Q学习算法第24-25页
   ·基于行为分解奖赏函数的SA-Q学习算法第25-27页
     ·基于行为分解奖赏函数的设计第25-26页
     ·基于行为分解奖赏函数的SA-Q学习算法描述第26-27页
   ·基于行为分解奖赏函数的SA-Q学习移动机器人路径规划仿真实验第27-36页
     ·传感器配置和移动机器人状态描述第27-28页
     ·输入输出变量选择第28-29页
     ·行为分解奖赏函数设计第29-30页
     ·动作选择策略设计第30-31页
     ·仿真实验第31-36页
   ·本章小结第36-38页
4 基于动态规划的SA-Q学习移动机器人路径规划第38-50页
   ·动态规划第38-39页
     ·动态规划基本思想第38页
     ·动态规划解题步骤第38-39页
   ·基于动态规划的SA-Q学习算法第39-44页
     ·基于动态规划的O学习算法基本思想第40页
     ·基于动态规划的SA-Q学习算法描述第40-44页
   ·基于动态规划的SA-Q学习移动机器人路径规划仿真实验第44-48页
     ·仿真环境第44-46页
     ·仿真结果与分析第46-48页
   ·本章小结第48-50页
5 基于模糊推理的SA-Q学习移动机器人路径规划第50-64页
   ·模糊推理系统第50-51页
     ·模糊推理的系统结构第50-51页
     ·Takagi-Sugeno模糊推理方法第51页
   ·基于模糊推理的SA-Q学习算法第51-55页
     ·基于模糊推理的SA-Q学习算法基本思想第52-53页
     ·基于模糊推理的SA-Q学习算法描述第53-55页
   ·基于模糊推理的SA-Q学习移动机器人路径规划仿真实验第55-62页
     ·输入输出变量选择第55页
     ·变量模糊化第55-56页
     ·模糊推理规则库第56-58页
     ·动作选择策略和奖赏函数设计第58-59页
     ·MATLAB仿真实验第59-62页
   ·本章小结第62-64页
6 结论与展望第64-66页
   ·结论第64-65页
   ·工作展望第65-66页
致谢第66-68页
参考文献第68-71页

论文共71页,点击 下载论文
上一篇:基于SOA的路灯监控系统
下一篇:嵌入式自动导引小车(AGV)系统研究与设计