首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

强化学习在足球机器人仿真中的应用

摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-16页
   ·机器人足球比赛的起源及发展第11-13页
     ·FIRA 简介第11-12页
     ·RoboCup 的发展第12-13页
   ·足球机器人仿真的研究现状第13-14页
   ·足球机器人研究的目的与意义第14页
   ·本文研究的主要内容第14-16页
第二章 MSRS 11vs11 足球机器人仿真比赛平台第16-23页
   ·机器人足球系统简介第16-18页
     ·机器人子系统第17页
     ·视觉子系统第17页
     ·决策子系统第17-18页
     ·无线通讯子系统第18页
   ·足球机器人仿真平台第18-22页
     ·MSRS 仿真平台简介第18-19页
     ·MSRS 仿真平台的结构第19页
     ·MSRS 仿真平台模式第19-21页
     ·比赛场地环境第21-22页
   ·本章小结第22-23页
第三章 强化学习第23-33页
   ·强化学习的发展及研究现状第23-24页
   ·强化学习的基本原理和模型第24-28页
     ·基本原理第25页
     ·强化学习模型第25-27页
     ·马尔可夫决策过程(MDP)第27-28页
   ·强化学习的几种经典算法第28-32页
     ·瞬时差分算法 TD(Temporal Difference Algorithm)第28-29页
     ·Q 学习算法第29-30页
     ·SARSA 学习算法第30-31页
     ·一种改进的 SARSA 学习算法第31-32页
   ·强化学习的主要应用第32页
   ·本章小结第32-33页
第四章 基于强化学习的比赛策略的应用研究第33-46页
   ·强化学习应用在单智能体的学习过程中第33-38页
     ·仿真环境的离散化第33-34页
     ·动作函数的设计第34页
     ·Q 值的更新和动作选择的方式第34-36页
     ·奖赏函数的设置第36页
     ·仿真实验数据分析第36-38页
   ·强化学习在 1VS1 对抗比赛中的应用第38-40页
     ·仿真环境的离散化第38-39页
     ·动作函数的设计第39页
     ·奖赏函数的设计第39-40页
     ·Q 值的更新和动作的选择第40页
     ·仿真实验数据分析第40页
   ·多智能体的学习第40-45页
     ·任务描述第41页
     ·智能体可以采取的动作第41-42页
     ·状态变量的设置第42-44页
     ·奖赏函数的设定第44页
     ·仿真实验数据分析第44-45页
   ·本章小结第45-46页
第五章 结论与展望第46-48页
参考文献第48-53页
致谢第53-54页
附录 A:(攻读硕士学位期间发表论文目录)第54-55页
附录 B:(攻读硕士学位期间获得证书)第55-57页
摘要第57-60页
Abstract第60-63页

论文共63页,点击 下载论文
上一篇:能量均衡的无线传感网络分簇路由研究
下一篇:基于SVM的WSN移动节点定位算法研究