| 摘要 | 第1-4页 |
| ABSTRACT | 第4-8页 |
| 第一章 绪论 | 第8-13页 |
| ·研究背景与研究意义 | 第8-9页 |
| ·国内外研究现状 | 第9-12页 |
| ·论文主要内容及构成 | 第12-13页 |
| 第二章 足球机器人系统 | 第13-23页 |
| ·实物足球机器人比赛系统 | 第13-15页 |
| ·足球机器人仿真比赛系统 | 第15-22页 |
| ·Robot Soccer v1.5a仿真平台介绍 | 第16页 |
| ·5vs5仿真平台的运动模型 | 第16-20页 |
| ·基于Robot Soccer v1.5a编程开发的向导 | 第20-22页 |
| ·小结 | 第22-23页 |
| 第三章 决策系统总体结构及其强化学习算法 | 第23-35页 |
| ·决策系统设计要求 | 第23-24页 |
| ·决策系统总体结构 | 第24-25页 |
| ·下层智能体结构的选择 | 第25-29页 |
| ·Agent的定义 | 第26页 |
| ·Agent的体系结构 | 第26-29页 |
| ·协调层强化学习算法选择 | 第29-34页 |
| ·强化学习概念和原理 | 第29-30页 |
| ·强化学习系统的组成要素 | 第30-31页 |
| ·强化学习分类 | 第31-32页 |
| ·TD学习算法 | 第32页 |
| ·Q学习算法 | 第32-34页 |
| ·小结 | 第34-35页 |
| 第四章 基于改进Q学习的决策算法 | 第35-57页 |
| ·决策方式 | 第35-37页 |
| ·Q学习算法改进 | 第37-40页 |
| ·基于改进Q学习的协调层设计 | 第40-48页 |
| ·基于Q学习的策略选择模块 | 第41-46页 |
| ·角色分配模块的设计 | 第46-48页 |
| ·运动控制层设计 | 第48-56页 |
| ·小结 | 第56-57页 |
| 第五章 软件实现与效果分析 | 第57-64页 |
| ·软件设计目标 | 第57页 |
| ·软件设计 | 第57-61页 |
| ·仿真实验与分析 | 第61-63页 |
| ·小结 | 第63-64页 |
| 第六章 结论与展望 | 第64-67页 |
| ·结论 | 第64-65页 |
| ·展望 | 第65-67页 |
| 参考文献 | 第67-72页 |
| 致谢 | 第72-73页 |
| 攻读学位期间主要的研究成果 | 第73页 |