首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于强化学习的足球机器人比赛决策策略研究

摘要第1-6页
Abstract第6-10页
第一章 绪论第10-19页
   ·课题的背景及意义第10-11页
   ·国内外研究现状第11-17页
     ·足球机器人比赛的发展第11-13页
     ·足球机器人相关技术的研究现状第13-16页
     ·强化学习算法在足球机器人比赛中的研究现状第16-17页
     ·多智能体强化学习算法的研究现状第17页
   ·论文研究工作第17-19页
第二章 强化学习基本理论第19-24页
   ·强化学习算法原理第19-20页
   ·马尔可夫决策过程第20-21页
   ·Q 学习算法第21-22页
   ·探索策略第22-23页
   ·本章小结第23-24页
第三章 基于内省推理的多智能体强化学习算法以及改进算法第24-32页
   ·多智能体强化学习算法第24-25页
   ·基于内省推理的虚拟行动 Q 学习算法第25-27页
   ·贝叶斯分类算法第27-29页
   ·改进的内省推理多智能体强化学习算法第29-31页
   ·本章小结第31-32页
第四章 多智能体强化学习算法在足球机器人比赛决策策略中的应用第32-44页
   ·决策系统的结构第32-33页
   ·多智能体的角色分配策略第33-36页
   ·主攻队员的动作选择第36-38页
   ·协攻队员的动作选择第38-41页
   ·实验结果及分析第41-43页
   ·本章小结第43-44页
第五章 足球机器人比赛系统的设计与开发第44-52页
   ·足球机器人比赛仿真平台系统结构第44页
   ·仿真平台简介第44-48页
   ·接口函数第48-49页
   ·决策策略模块第49-50页
   ·学习算法模块第50-51页
   ·动作模块第51页
   ·本章小结第51-52页
第六章 结论第52-53页
参考文献第53-55页
在学研究成果第55-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:一类混沌系统的鲁棒容错控制
下一篇:移摆型机械手的运动分析与研究