首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于分层强化学习的RoboCup 3D球队的设计与实现

学位论文版权使用授权书第1-5页
摘要第5-7页
ABSTRACT第7-12页
第1章 绪论第12-21页
   ·问题的提出第12-18页
     ·MAS的研究现状第12-14页
     ·强化学习的研究现状第14-17页
     ·RoboCup 3D的研究现状第17-18页
   ·研究的意义第18-19页
   ·本文的工作与创新第19-20页
   ·论文的组织结构第20-21页
第2章 强化学习第21-43页
   ·简介第21-24页
     ·强化学习的组成部分第21-22页
     ·强化学习的框架第22-24页
   ·Q-学习第24-28页
     ·Q-学习原理第24-26页
     ·Q-学习系统的结构及神经网络实现第26-28页
   ·连续状态空间的强化学习第28-30页
     ·函数逼近器与强化学习第28-29页
     ·函数逼近器的一般在线实现第29-30页
   ·HEDGER强化学习算法改进第30-42页
     ·局部加权回归分析第30-33页
     ·HEDGER算法描述第33-36页
     ·提高LWR的容错性第36-38页
     ·提高LWR的计算效率第38-42页
   ·小结第42-43页
第3章 分层强化学习框架第43-47页
   ·原则第43-44页
   ·形式化第44-45页
   ·实例第45-46页
     ·实例1:截球-球员个人技能第45页
     ·实例2:带球-球员复杂个人技能第45-46页
   ·小结第46-47页
第4章 ROBOCUP3D仿真服务器平台分析第47-56页
   ·SPADES简介第47-50页
     ·SPADES的结构第48-49页
     ·仿真过程第49-50页
   ·ODE简介第50-52页
     ·刚体的属性第50-51页
     ·力,扭距与冲量第51页
     ·约束第51-52页
   ·AGENT与COMMUNICATION SERVER的通讯第52页
   ·原理第52-55页
     ·过程第52-54页
     ·Agent的输入信息格式第54-55页
     ·Agent的输出信息格式第55页
   ·小结第55-56页
第5章 ROBOCUP 3D物理模型分析第56-67页
   ·ROBOCUP 3D源码实现过程第56-61页
     ·刚体所受的力第58页
     ·kick动作的实现第58-60页
     ·drive动作的实现第60页
     ·摩擦力的实现第60-61页
     ·物理模型的实现过程第61页
   ·调用ODE库来近似物理模型第61-65页
     ·刚体位置信息的获得第62-64页
     ·调用ODE库第64-65页
   ·球员世界模型的维护第65-66页
   ·小结第66-67页
第6章 3D球队的设计与实现第67-74页
   ·球员的结构第67-69页
   ·球员的动作第69-71页
     ·基本技能第69-71页
     ·高级技能第71页
   ·球员的推理第71-73页
     ·队的行为第72页
     ·状态第72页
     ·目标评价函数第72页
     ·动作选择第72-73页
   ·小结第73-74页
第7章 实验结果与分析第74-79页
   ·截球-球员个人技能的实验第74-77页
   ·带球实验第77-79页
第8章 工作总结与展望第79-81页
参考文献第81-85页
致谢第85-86页
论文及科研情况第86页

论文共86页,点击 下载论文
上一篇:企业经营者约束机制完善研究
下一篇:“混凝气浮-A/O”工艺处理亚铵法造纸废水