基于强化学习的足球机器人比赛决策策略研究

摘要	第1-6页
Abstract	第6-10页
第一章绪论	第10-19页
·课题的背景及意义	第10-11页
·国内外研究现状	第11-17页
·足球机器人比赛的发展	第11-13页
·足球机器人相关技术的研究现状	第13-16页
·强化学习算法在足球机器人比赛中的研究现状	第16-17页
·多智能体强化学习算法的研究现状	第17页
·论文研究工作	第17-19页
第二章强化学习基本理论	第19-24页
·强化学习算法原理	第19-20页
·马尔可夫决策过程	第20-21页
·Q 学习算法	第21-22页
·探索策略	第22-23页
·本章小结	第23-24页
第三章基于内省推理的多智能体强化学习算法以及改进算法	第24-32页
·多智能体强化学习算法	第24-25页
·基于内省推理的虚拟行动 Q 学习算法	第25-27页
·贝叶斯分类算法	第27-29页
·改进的内省推理多智能体强化学习算法	第29-31页
·本章小结	第31-32页
第四章多智能体强化学习算法在足球机器人比赛决策策略中的应用	第32-44页
·决策系统的结构	第32-33页
·多智能体的角色分配策略	第33-36页
·主攻队员的动作选择	第36-38页
·协攻队员的动作选择	第38-41页
·实验结果及分析	第41-43页
·本章小结	第43-44页
第五章足球机器人比赛系统的设计与开发	第44-52页
·足球机器人比赛仿真平台系统结构	第44页
·仿真平台简介	第44-48页
·接口函数	第48-49页
·决策策略模块	第49-50页
·学习算法模块	第50-51页
·动作模块	第51页
·本章小结	第51-52页
第六章结论	第52-53页
参考文献	第53-55页
在学研究成果	第55-56页
致谢	第56页