首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

强化学习在仿真足球机器人决策中的应用研究

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-15页
   ·研究背景第10-12页
     ·FIRA 简介第11-12页
     ·RoboCup 简介第12页
   ·研究的目的与意义第12-13页
   ·本文研究的主要内容第13-15页
第二章 MSRS 11vs11 足球机器人仿真比赛平台第15-26页
   ·机器人足球系统简介第15-18页
     ·机器人本体子系统第16-17页
     ·视觉子系统第17页
     ·决策子系统第17页
     ·无线通讯子系统第17-18页
   ·足球机器人仿真平台第18-22页
     ·MSRS 11vs11 仿真平台简介第18-19页
     ·MSRS 仿真平台的结构第19页
     ·MSRS 仿真平台模式第19-22页
     ·比赛场地环境第22页
   ·MSRS 11vs11 比赛规则介绍第22-26页
     ·比赛时间第22-23页
     ·比赛次序第23页
     ·记分方法第23-24页
     ·点球判罚第24页
     ·门球判罚第24-25页
     ·争球判罚第25-26页
第三章 强化学习第26-34页
   ·强化学习的基本原理和模型第26-28页
     ·基本原理第26-27页
     ·强化学习模型第27-28页
     ·马尔可夫决策过程(MDP)第28页
   ·强化学习的发展及研究现状第28-29页
   ·Sarsa 学习算法第29-30页
     ·Sarsa 学习算法简介第29-30页
     ·Sarsa 学习算法的实现第30页
   ·强化学习的其它典型算法第30-33页
     ·瞬时差分算法TD(Temporal Difference Algorithm)第30-31页
     ·Q-学习算法第31-32页
     ·R-学习算法第32-33页
   ·强化学习的主要应用第33页
   ·本章小结第33-34页
第四章 基于强化学习的比赛策略的应用研究第34-50页
   ·仿真足球机器人赛场环境的离散化第34-38页
     ·仿真环境描述第34-35页
     ·仿真环境的离散化第35-38页
   ·动作函数的设计第38-42页
     ·足球机器人的运动学模型第39-40页
     ·到点动作设计第40-41页
     ·转向目标点动作设计第41页
     ·射门动作设计第41-42页
   ·奖赏函数的设计第42页
   ·Q 值的初始化和更新第42页
   ·Sarsa 学习在比赛决策中的应用第42-44页
   ·其它射门算法第44-47页
     ·切入圆射门算法第44-45页
     ·动态基准圆射门算法第45-47页
   ·仿真实验及结果分析第47-50页
     ·仿真实验结果和分析第47-49页
     ·本算法与其它算法的比较第49-50页
第五章 结论与展望第50-51页
参考文献第51-54页
致谢第54-55页
附录:(攻读硕士学位期间发表论文目录)第55-56页
摘要第56-59页
 Abstract第59-61页

论文共61页,点击 下载论文
上一篇:基于单亲遗传算法的RoboCup机器人足球比赛策略研究
下一篇:三轮全向足球机器人控制算法研究