首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

一种足球机器人多智能体对抗系统的分层变学习率增强式学习方法

0 前言第1-8页
1 足球机器人及多智能体系统概述第8-22页
   ·足球机器人比赛的出现第8-9页
   ·多智能体系统的特性和研究内容第9-11页
     ·多智能体系统的特性第9-10页
     ·多智能体系统的研究内容第10-11页
   ·多智能体系统的应用领域第11-13页
     ·工业应用第11-12页
     ·信息管理与商务应用第12-13页
     ·医学应用第13页
     ·娱乐应用第13页
   ·足球机器人比赛第13-14页
   ·RoboCup仿真足球机器人系统第14-21页
     ·系统整体框架第14-15页
     ·对象的运动第15-16页
     ·碰撞第16页
     ·风和环境干扰第16页
     ·球员的动作第16-17页
     ·球员的体力问题第17-18页
     ·球员的感知信息第18-21页
     ·仿真参数特点第21页
   ·本章小结第21-22页
2 足球机器人工作空间模糊建模第22-32页
   ·模糊理论概述第22-25页
     ·模糊的基本概念第23-24页
     ·模糊集合与经典集合的联系第24页
     ·模糊矩阵与模糊关系第24-25页
   ·足球机器人状态空间的模糊表示第25-30页
     ·仿真足球机器人球场环境概述第25-26页
     ·从足球机器人系统中抽取的实验模型第26-27页
     ·场上物体位置信息的模糊化第27-30页
     ·输出的状态空间第30页
   ·本章小结第30-32页
3 分层增强式多智能体学习系统设计第32-41页
   ·增强式学习概述第32-33页
     ·增强式学习的基本要素第32页
     ·Q-learning算法第32-33页
     ·在线(On Policy)学习和离线(Off Policy)学习第33页
   ·分层增强式学习算法MAX-Q第33-37页
     ·分层学习结构第34页
     ·分层学习方法第34-35页
     ·分层学习的优点第35-37页
   ·足球机器人系统的分层增强式学习结构及算法第37-38页
   ·计算机仿真实验与结果分析第38-39页
   ·本章小结第39-41页
4 多智能体对抗系统第41-49页
   ·对抗系统的特点第41页
   ·对抗系统中策略的评价第41-42页
   ·WOLF(Win or Learn Fast)学习法则第42-46页
   ·应用变学习率法则的分层增强式学习算法第46-47页
   ·计算机仿真实验与结果分析第47-48页
   ·本章小结第48-49页
5 总结与展望第49-51页
致谢第51-52页
参考文献第52-54页

论文共54页,点击 下载论文
上一篇:马克思恩格斯对资本主义的剖析
下一篇:安肠愈疡汤口服合生肌散灌肠治疗溃疡性结肠炎的疗效观察及机制研究