摘要 | 第1-6页 |
ABSTRACT | 第6-11页 |
第1章 绪论 | 第11-17页 |
·研究背景 | 第11-14页 |
·机器人足球的分类与发展状况 | 第12-13页 |
·机器人足球仿真赛研究现状 | 第13-14页 |
·研究目的和实际意义 | 第14-15页 |
·本文研究的主要内容 | 第15-17页 |
第2章 RoboCup 仿真系统 | 第17-30页 |
·机器人足球系统的结构及其工作原理 | 第17-19页 |
·机器人本体子系统 | 第17-18页 |
·视觉子系统 | 第18页 |
·决策子系统 | 第18-19页 |
·无线通讯子系统 | 第19页 |
·RoboCup 仿真平台介绍 | 第19-24页 |
·Soccer Server 介绍 | 第22页 |
·Soccer Client 介绍 | 第22页 |
·Soccer Monitor 介绍 | 第22页 |
·本文构建的仿真系统 | 第22-24页 |
·机器人足球比赛规则 | 第24-26页 |
·比赛时间和计分方法 | 第24页 |
·点球(Penalty-Kick) | 第24-25页 |
·球门球(Goal-kick) | 第25页 |
·争球(Free-kick) | 第25-26页 |
·机器人小车技术 | 第26-28页 |
·机器人小车技术设计方法 | 第26-27页 |
·机器人小车技术决策 | 第27-28页 |
·机器人小车动力学 | 第28-29页 |
·本章小结 | 第29-30页 |
第3章 激励学习理论及其算法分析 | 第30-42页 |
·激励学习基本原理和模型 | 第30-34页 |
·基本原理 | 第30-32页 |
·激励学习模型 | 第32-34页 |
·激励学习的基础知识 | 第34-35页 |
·评价函数 | 第34页 |
·Markov 决策过程 | 第34-35页 |
·激励学习经典算法 | 第35-37页 |
·Q 学习算法 | 第35-36页 |
·Sarsa 学习算法 | 第36-37页 |
·Swarm 激励学习算法 | 第37-39页 |
·Swarm 算法分析 | 第37页 |
·Swarm 算法设计实现 | 第37-39页 |
·激励学习的其它典型算法 | 第39-40页 |
·R-学习算法 | 第39页 |
·瞬时差分算法 TD(Temporal Difference Algorithm) | 第39-40页 |
·激励学习的应用 | 第40-41页 |
·本章小结 | 第41-42页 |
第4章 基于激励学习的比赛策略的应用研究 | 第42-61页 |
·仿真足球机器人赛场环境 | 第42-44页 |
·基本运动策略 | 第44-49页 |
·程序的接口 API 函数 | 第44-45页 |
·基本动作函数实现 | 第45-49页 |
·Swarm 学习的机器人技术动作的设计 | 第49-52页 |
·射门动作技术 | 第49-50页 |
·截球动作技术 | 第50-51页 |
·带球动作技术 | 第51-52页 |
·Swarm 学习奖赏函数的设计 | 第52-53页 |
·Swarm 学习在比赛决策中的应用 | 第53-55页 |
·Swarm 学习算法在 MSRS 平台的具体应用 | 第55-56页 |
·仿真实验及结果比较分析 | 第56-60页 |
·本章小结 | 第60-61页 |
第5章 总结与展望 | 第61-62页 |
参考文献 | 第62-66页 |
致谢 | 第66-67页 |
附录:(攻读硕士学位期间发表论文目录) | 第67-68页 |
摘要 | 第68-71页 |
ABSTRACT | 第71-74页 |