首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于强化学习的RoboCup 2D高层抢球策略研究

摘要第1-5页
Abstract第5-9页
第一章 绪论第9-13页
   ·研究背景及选题意义第9-10页
   ·国内外研究现状第10-11页
   ·本论文的主要内容第11-13页
第二章 ROBOCUP 2D平台第13-21页
   ·ROBOCUP比赛第13页
   ·ROBOCUP 2D平台架构第13-16页
   ·ROBOCUP 2D问题模型第16-17页
   ·ROBOCUP 2D问题特点第17-18页
   ·ROBOCUP 2D子问题第18-20页
   ·本章小结第20-21页
第三章 强化学习第21-34页
   ·强化学习概述第21-22页
   ·强化学习问题第22-24页
   ·MDP模型求解强化学习问题第24-27页
   ·强化学习算法第27-33页
   ·本章小结第33-34页
第四章 高层抢球策略的强化学习第34-43页
   ·问题描述第34页
   ·KEEPAWAY的高层动作和总体策略第34-36页
   ·KEEPAWAY中高层抢球策略的强化学习第36-39页
   ·实验分析第39-42页
   ·本章小结第42-43页
第五章 高层抢球策略的任务间迁移学习第43-51页
   ·问题描述第43页
   ·迁移学习和策略重用第43-46页
   ·KEEPAWAY中高层抢球策略的任务间迁移学习第46-48页
   ·实验分析第48-50页
   ·本章小结第50-51页
第六章 总结和展望第51-53页
   ·全文工作总结第51-52页
   ·未来展望第52-53页
参考文献第53-57页
致谢第57-58页
攻读硕士学位期间的学术论文、科研项目与相关奖项第58页

论文共58页,点击 下载论文
上一篇:基于MapReduce和遗传算法的粗糙集属性约简研究
下一篇:基于纳米银膜的微振动光纤传感器及其应用的研究