基于强化学习的足球机器人决策系统设计

摘要	第1-4页
ABSTRACT	第4-8页
第一章绪论	第8-13页
·研究背景与研究意义	第8-9页
·国内外研究现状	第9-12页
·论文主要内容及构成	第12-13页
第二章足球机器人系统	第13-23页
·实物足球机器人比赛系统	第13-15页
·足球机器人仿真比赛系统	第15-22页
·Robot Soccer v1.5a仿真平台介绍	第16页
·5vs5仿真平台的运动模型	第16-20页
·基于Robot Soccer v1.5a编程开发的向导	第20-22页
·小结	第22-23页
第三章决策系统总体结构及其强化学习算法	第23-35页
·决策系统设计要求	第23-24页
·决策系统总体结构	第24-25页
·下层智能体结构的选择	第25-29页
·Agent的定义	第26页
·Agent的体系结构	第26-29页
·协调层强化学习算法选择	第29-34页
·强化学习概念和原理	第29-30页
·强化学习系统的组成要素	第30-31页
·强化学习分类	第31-32页
·TD学习算法	第32页
·Q学习算法	第32-34页
·小结	第34-35页
第四章基于改进Q学习的决策算法	第35-57页
·决策方式	第35-37页
·Q学习算法改进	第37-40页
·基于改进Q学习的协调层设计	第40-48页
·基于Q学习的策略选择模块	第41-46页
·角色分配模块的设计	第46-48页
·运动控制层设计	第48-56页
·小结	第56-57页
第五章软件实现与效果分析	第57-64页
·软件设计目标	第57页
·软件设计	第57-61页
·仿真实验与分析	第61-63页
·小结	第63-64页
第六章结论与展望	第64-67页
·结论	第64-65页
·展望	第65-67页
参考文献	第67-72页
致谢	第72-73页
攻读学位期间主要的研究成果	第73页