摘要 | 第1-4页 |
Abstract | 第4-8页 |
第一章 绪论 | 第8-17页 |
·RoboCup介绍 | 第8页 |
·RoboCup赛事概况 | 第8-9页 |
·RoboCup仿真2D概述 | 第9-12页 |
·RoboCup仿真2D的研究现状 | 第12-15页 |
·安徽大学仿真2D机器人足球研究现状 | 第15页 |
·本文的主要工作和内容组织 | 第15-17页 |
第二章 RoboCup仿真2D平台介绍 | 第17-23页 |
·平台介绍 | 第17-21页 |
·平台结构特点 | 第21-22页 |
·比赛流程 | 第22-23页 |
第三章 RoboCup仿真2D中的基本模型 | 第23-33页 |
·动作模型 | 第23-27页 |
·运动模型 | 第27-28页 |
·感知模型 | 第28-30页 |
·体力模型 | 第30页 |
·裁判模型 | 第30-33页 |
第四章 仿真2D的阵型与跑位 | 第33-38页 |
·Delaunay三角化 | 第33-34页 |
·Delaunay三角化算法 | 第34-36页 |
·Delaunay三角化后的阵型 | 第36-38页 |
第五章 RoboCup中的学习算法 | 第38-51页 |
·马尔可夫决策过程 | 第38页 |
·动态规划 | 第38-39页 |
·人工神经网络 | 第39-43页 |
·启发式搜索 | 第43-48页 |
·强化学习 | 第48-50页 |
·学习算法在RoboCup中的应用 | 第50-51页 |
第六章 基于多agent Q学习的RoboCup局部配合策略 | 第51-57页 |
·随机策略(Stochastic Game,SG) | 第51页 |
·状态-动作对的确定 | 第51-52页 |
·reward值的确定 | 第52-55页 |
·状态-动作表中的Q值更新 | 第55页 |
·实验结果 | 第55-57页 |
第七章 总结与展望 | 第57-59页 |
·总结 | 第57-58页 |
·展望 | 第58-59页 |
参考文献 | 第59-62页 |
攻读硕士期间发表的论文 | 第62-63页 |
致谢 | 第63页 |