基于强化学习的机器人足球仿真系统研究与程序设计

摘要	第1-7页
Abstract	第7-13页
第1章绪论	第13-19页
·研究背景及意义	第13页
·RoboCup 历史和现状	第13-15页
·RoboCup 在中国	第15-16页
·机器人足球仿真比赛研究现状	第16-17页
·本文主要研究内容	第17-19页
第2章 RoboCup 仿真系统平台研究	第19-35页
·RoboCup 仿真平台	第19-23页
·比赛平台	第19-21页
·球员客户端	第21-22页
·平台特点	第22-23页
·Soccer Server 仿真模型	第23-32页
·场地模型	第23-24页
·运动模型	第24-25页
·视觉模型	第25-28页
·听觉模型	第28-29页
·身体感知模型	第29-30页
·移动模型	第30-31页
·加速模型和体力模型	第31-32页
·比赛平台安装使用	第32-34页
·机器人足球仿真源码包	第32页
·安装	第32-33页
·使用	第33-34页
·本章小结	第34-35页
第3章 RoboCup 仿真程序设计	第35-48页
·Agent 结构模型	第35-38页
·慎思Agent 结构模型	第35-37页
·反应Agent 结构模型	第37-38页
·混合Agent 结构模型	第38页
·Agent 程序框架	第38-40页
·Agent 程序设计	第40-41页
·Agent 底层动作	第41-45页
·带球	第41-42页
·传球	第42-43页
·射门	第43-44页
·截球	第44-45页
·Agent 上层策略	第45-47页
·场景处理函数	第45-46页
·评估函数策略	第46-47页
·本章小结	第47-48页
第4章强化学习	第48-57页
·强化学习概念	第48-49页
·强化学习基本原理	第49-50页
·强化学习系统组成要素	第50-51页
·强化学习主要算法	第51-55页
·动态规划	第51-52页
·蒙特卡罗算法	第52页
·瞬时差分算法	第52-53页
·Q-学习算法	第53-55页
·强化学习主要应用	第55-56页
·本章小结	第56-57页
第5章极大极小Q-学习算法研究及在RoboCup 中的应用	第57-67页
·极大极小算法	第57-58页
·极大极小Q-学习算法主要原理	第58-60页
·算法应用	第60-66页
·最短路径问题	第60-64页
·RoboCup 中的对抗问题	第64-66页
·本章小结	第66-67页
结论	第67-68页
参考文献	第68-71页
攻读硕士学位期间所发表的学术论文	第71-73页
致谢	第73-74页
大摘要	第74-78页