首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于激励学习算法的移动机器人避障规划研究

摘要第1-4页
ABSTRACT第4-7页
1 绪论第7-14页
   ·课题选题背景第7页
   ·移动机器人避障规划定义及特点第7-8页
   ·机器人避障规划方法概述第8-11页
     ·基于环境模型的避障规划方法第8-10页
     ·基于行为的避障规划方法第10-11页
   ·移动机器人避障规划发展趋势第11-12页
   ·课题研究意义第12页
   ·本文主要内容第12-14页
2 基于混合式架构的自主移动机器人避障规划平台第14-22页
   ·引言第14页
   ·自主移动机器人的基本运动结构第14-15页
   ·Khepera II 自主移动机器人系统概述第15-21页
     ·Khepera II 自主移动机器人平台第15-16页
     ·Khepera II 自主移动机器人的体系结构第16-21页
   ·机器人运动控制模块第21页
   ·本章小结第21-22页
3 学习算法研究第22-30页
   ·激励学习的特点第22-23页
   ·Markov 决策过程与激励学习系统第23-25页
     ·Markov 决策过程第23页
     ·激励学习系统的结构模型第23-24页
     ·激励学习系统的基本要素第24-25页
   ·蒙特卡洛算法(Monte Carlo)第25-26页
   ·瞬时差分算法第26-27页
   ·Q 学习算法第27-29页
     ·Q 学习基本算法第27-28页
     ·Q 学习算法的收敛性分析第28页
     ·Q 函数实现方式第28-29页
   ·本章小结第29-30页
4 基于 Q 学习的自主移动机器人避障系统设计第30-35页
   ·基于 Q 学习的机器人避障系统框架第30页
   ·机器人 Q 学习要素设计第30-32页
     ·环境状态表示第30-31页
     ·动作空间表示第31-32页
     ·奖赏函数设计第32页
     ·动作选择策略第32页
   ·基于 Q 学习的机器人避障系统设计第32-34页
   ·本章小结第34-35页
5 基于 RBF 神经网络的 Q 学习避障算法第35-50页
   ·RBF 神经网络的结构及基本原理第35-37页
     ·RBF 神经网络的结构第36页
     ·RBF 神经网络基本原理第36-37页
   ·RBF 神经网络学习方法第37-38页
     ·RBF 神经网络隐含层学习第37页
     ·RBF 神经网络输出层的权值学习第37-38页
   ·基于 RBF 神经网络的 Q 学习避障系统设计第38-39页
     ·RBF 神经网络的输入输出第38页
     ·强化函数定义第38页
     ·样本集生成第38-39页
   ·基于 RBF 神经网络的 Q 学习机器人避障实验第39-49页
     ·基于 RBF 神经网络的 Q 学习避障算法第39-40页
     ·仿真结果及分析第40-49页
   ·本章小结第49-50页
6 总结与展望第50-52页
   ·总结第50页
   ·进一步的工作展望第50-52页
致谢第52-53页
参考文献第53-56页
附录第56页
 A. 作者在攻读学位期间发表的论文目录第56页

论文共56页,点击 下载论文
上一篇:集中供暖系统节能控制技术研究
下一篇:重庆市民间志愿者组织的成长与发展研究