一种足球机器人多智能体对抗系统的分层变学习率增强式学习方法

0 前言	第1-8页
1 足球机器人及多智能体系统概述	第8-22页
·足球机器人比赛的出现	第8-9页
·多智能体系统的特性和研究内容	第9-11页
·多智能体系统的特性	第9-10页
·多智能体系统的研究内容	第10-11页
·多智能体系统的应用领域	第11-13页
·工业应用	第11-12页
·信息管理与商务应用	第12-13页
·医学应用	第13页
·娱乐应用	第13页
·足球机器人比赛	第13-14页
·RoboCup仿真足球机器人系统	第14-21页
·系统整体框架	第14-15页
·对象的运动	第15-16页
·碰撞	第16页
·风和环境干扰	第16页
·球员的动作	第16-17页
·球员的体力问题	第17-18页
·球员的感知信息	第18-21页
·仿真参数特点	第21页
·本章小结	第21-22页
2 足球机器人工作空间模糊建模	第22-32页
·模糊理论概述	第22-25页
·模糊的基本概念	第23-24页
·模糊集合与经典集合的联系	第24页
·模糊矩阵与模糊关系	第24-25页
·足球机器人状态空间的模糊表示	第25-30页
·仿真足球机器人球场环境概述	第25-26页
·从足球机器人系统中抽取的实验模型	第26-27页
·场上物体位置信息的模糊化	第27-30页
·输出的状态空间	第30页
·本章小结	第30-32页
3 分层增强式多智能体学习系统设计	第32-41页
·增强式学习概述	第32-33页
·增强式学习的基本要素	第32页
·Q-learning算法	第32-33页
·在线(On Policy)学习和离线(Off Policy)学习	第33页
·分层增强式学习算法MAX-Q	第33-37页
·分层学习结构	第34页
·分层学习方法	第34-35页
·分层学习的优点	第35-37页
·足球机器人系统的分层增强式学习结构及算法	第37-38页
·计算机仿真实验与结果分析	第38-39页
·本章小结	第39-41页
4 多智能体对抗系统	第41-49页
·对抗系统的特点	第41页
·对抗系统中策略的评价	第41-42页
·WOLF(Win or Learn Fast)学习法则	第42-46页
·应用变学习率法则的分层增强式学习算法	第46-47页
·计算机仿真实验与结果分析	第47-48页
·本章小结	第48-49页
5 总结与展望	第49-51页
致谢	第51-52页
参考文献	第52-54页