| 摘要 | 第1-6页 |
| ABSTRACT | 第6-11页 |
| 第1章 绪论 | 第11-17页 |
| ·研究背景 | 第11-14页 |
| ·机器人足球的分类与发展状况 | 第12-13页 |
| ·机器人足球仿真赛研究现状 | 第13-14页 |
| ·研究目的和实际意义 | 第14-15页 |
| ·本文研究的主要内容 | 第15-17页 |
| 第2章 RoboCup 仿真系统 | 第17-30页 |
| ·机器人足球系统的结构及其工作原理 | 第17-19页 |
| ·机器人本体子系统 | 第17-18页 |
| ·视觉子系统 | 第18页 |
| ·决策子系统 | 第18-19页 |
| ·无线通讯子系统 | 第19页 |
| ·RoboCup 仿真平台介绍 | 第19-24页 |
| ·Soccer Server 介绍 | 第22页 |
| ·Soccer Client 介绍 | 第22页 |
| ·Soccer Monitor 介绍 | 第22页 |
| ·本文构建的仿真系统 | 第22-24页 |
| ·机器人足球比赛规则 | 第24-26页 |
| ·比赛时间和计分方法 | 第24页 |
| ·点球(Penalty-Kick) | 第24-25页 |
| ·球门球(Goal-kick) | 第25页 |
| ·争球(Free-kick) | 第25-26页 |
| ·机器人小车技术 | 第26-28页 |
| ·机器人小车技术设计方法 | 第26-27页 |
| ·机器人小车技术决策 | 第27-28页 |
| ·机器人小车动力学 | 第28-29页 |
| ·本章小结 | 第29-30页 |
| 第3章 激励学习理论及其算法分析 | 第30-42页 |
| ·激励学习基本原理和模型 | 第30-34页 |
| ·基本原理 | 第30-32页 |
| ·激励学习模型 | 第32-34页 |
| ·激励学习的基础知识 | 第34-35页 |
| ·评价函数 | 第34页 |
| ·Markov 决策过程 | 第34-35页 |
| ·激励学习经典算法 | 第35-37页 |
| ·Q 学习算法 | 第35-36页 |
| ·Sarsa 学习算法 | 第36-37页 |
| ·Swarm 激励学习算法 | 第37-39页 |
| ·Swarm 算法分析 | 第37页 |
| ·Swarm 算法设计实现 | 第37-39页 |
| ·激励学习的其它典型算法 | 第39-40页 |
| ·R-学习算法 | 第39页 |
| ·瞬时差分算法 TD(Temporal Difference Algorithm) | 第39-40页 |
| ·激励学习的应用 | 第40-41页 |
| ·本章小结 | 第41-42页 |
| 第4章 基于激励学习的比赛策略的应用研究 | 第42-61页 |
| ·仿真足球机器人赛场环境 | 第42-44页 |
| ·基本运动策略 | 第44-49页 |
| ·程序的接口 API 函数 | 第44-45页 |
| ·基本动作函数实现 | 第45-49页 |
| ·Swarm 学习的机器人技术动作的设计 | 第49-52页 |
| ·射门动作技术 | 第49-50页 |
| ·截球动作技术 | 第50-51页 |
| ·带球动作技术 | 第51-52页 |
| ·Swarm 学习奖赏函数的设计 | 第52-53页 |
| ·Swarm 学习在比赛决策中的应用 | 第53-55页 |
| ·Swarm 学习算法在 MSRS 平台的具体应用 | 第55-56页 |
| ·仿真实验及结果比较分析 | 第56-60页 |
| ·本章小结 | 第60-61页 |
| 第5章 总结与展望 | 第61-62页 |
| 参考文献 | 第62-66页 |
| 致谢 | 第66-67页 |
| 附录:(攻读硕士学位期间发表论文目录) | 第67-68页 |
| 摘要 | 第68-71页 |
| ABSTRACT | 第71-74页 |