基于强化学习的RoboCup 2D高层抢球策略研究

摘要	第1-5页
Abstract	第5-9页
第一章绪论	第9-13页
·研究背景及选题意义	第9-10页
·国内外研究现状	第10-11页
·本论文的主要内容	第11-13页
第二章 ROBOCUP 2D平台	第13-21页
·ROBOCUP比赛	第13页
·ROBOCUP 2D平台架构	第13-16页
·ROBOCUP 2D问题模型	第16-17页
·ROBOCUP 2D问题特点	第17-18页
·ROBOCUP 2D子问题	第18-20页
·本章小结	第20-21页
第三章强化学习	第21-34页
·强化学习概述	第21-22页
·强化学习问题	第22-24页
·MDP模型求解强化学习问题	第24-27页
·强化学习算法	第27-33页
·本章小结	第33-34页
第四章高层抢球策略的强化学习	第34-43页
·问题描述	第34页
·KEEPAWAY的高层动作和总体策略	第34-36页
·KEEPAWAY中高层抢球策略的强化学习	第36-39页
·实验分析	第39-42页
·本章小结	第42-43页
第五章高层抢球策略的任务间迁移学习	第43-51页
·问题描述	第43页
·迁移学习和策略重用	第43-46页
·KEEPAWAY中高层抢球策略的任务间迁移学习	第46-48页
·实验分析	第48-50页
·本章小结	第50-51页
第六章总结和展望	第51-53页
·全文工作总结	第51-52页
·未来展望	第52-53页
参考文献	第53-57页
致谢	第57-58页
攻读硕士学位期间的学术论文、科研项目与相关奖项	第58页