| 摘要 | 第1-4页 |
| Abstract | 第4-8页 |
| 第一章 绪论 | 第8-17页 |
| ·RoboCup介绍 | 第8页 |
| ·RoboCup赛事概况 | 第8-9页 |
| ·RoboCup仿真2D概述 | 第9-12页 |
| ·RoboCup仿真2D的研究现状 | 第12-15页 |
| ·安徽大学仿真2D机器人足球研究现状 | 第15页 |
| ·本文的主要工作和内容组织 | 第15-17页 |
| 第二章 RoboCup仿真2D平台介绍 | 第17-23页 |
| ·平台介绍 | 第17-21页 |
| ·平台结构特点 | 第21-22页 |
| ·比赛流程 | 第22-23页 |
| 第三章 RoboCup仿真2D中的基本模型 | 第23-33页 |
| ·动作模型 | 第23-27页 |
| ·运动模型 | 第27-28页 |
| ·感知模型 | 第28-30页 |
| ·体力模型 | 第30页 |
| ·裁判模型 | 第30-33页 |
| 第四章 仿真2D的阵型与跑位 | 第33-38页 |
| ·Delaunay三角化 | 第33-34页 |
| ·Delaunay三角化算法 | 第34-36页 |
| ·Delaunay三角化后的阵型 | 第36-38页 |
| 第五章 RoboCup中的学习算法 | 第38-51页 |
| ·马尔可夫决策过程 | 第38页 |
| ·动态规划 | 第38-39页 |
| ·人工神经网络 | 第39-43页 |
| ·启发式搜索 | 第43-48页 |
| ·强化学习 | 第48-50页 |
| ·学习算法在RoboCup中的应用 | 第50-51页 |
| 第六章 基于多agent Q学习的RoboCup局部配合策略 | 第51-57页 |
| ·随机策略(Stochastic Game,SG) | 第51页 |
| ·状态-动作对的确定 | 第51-52页 |
| ·reward值的确定 | 第52-55页 |
| ·状态-动作表中的Q值更新 | 第55页 |
| ·实验结果 | 第55-57页 |
| 第七章 总结与展望 | 第57-59页 |
| ·总结 | 第57-58页 |
| ·展望 | 第58-59页 |
| 参考文献 | 第59-62页 |
| 攻读硕士期间发表的论文 | 第62-63页 |
| 致谢 | 第63页 |