| 0 前言 | 第1-8页 |
| 1 足球机器人及多智能体系统概述 | 第8-22页 |
| ·足球机器人比赛的出现 | 第8-9页 |
| ·多智能体系统的特性和研究内容 | 第9-11页 |
| ·多智能体系统的特性 | 第9-10页 |
| ·多智能体系统的研究内容 | 第10-11页 |
| ·多智能体系统的应用领域 | 第11-13页 |
| ·工业应用 | 第11-12页 |
| ·信息管理与商务应用 | 第12-13页 |
| ·医学应用 | 第13页 |
| ·娱乐应用 | 第13页 |
| ·足球机器人比赛 | 第13-14页 |
| ·RoboCup仿真足球机器人系统 | 第14-21页 |
| ·系统整体框架 | 第14-15页 |
| ·对象的运动 | 第15-16页 |
| ·碰撞 | 第16页 |
| ·风和环境干扰 | 第16页 |
| ·球员的动作 | 第16-17页 |
| ·球员的体力问题 | 第17-18页 |
| ·球员的感知信息 | 第18-21页 |
| ·仿真参数特点 | 第21页 |
| ·本章小结 | 第21-22页 |
| 2 足球机器人工作空间模糊建模 | 第22-32页 |
| ·模糊理论概述 | 第22-25页 |
| ·模糊的基本概念 | 第23-24页 |
| ·模糊集合与经典集合的联系 | 第24页 |
| ·模糊矩阵与模糊关系 | 第24-25页 |
| ·足球机器人状态空间的模糊表示 | 第25-30页 |
| ·仿真足球机器人球场环境概述 | 第25-26页 |
| ·从足球机器人系统中抽取的实验模型 | 第26-27页 |
| ·场上物体位置信息的模糊化 | 第27-30页 |
| ·输出的状态空间 | 第30页 |
| ·本章小结 | 第30-32页 |
| 3 分层增强式多智能体学习系统设计 | 第32-41页 |
| ·增强式学习概述 | 第32-33页 |
| ·增强式学习的基本要素 | 第32页 |
| ·Q-learning算法 | 第32-33页 |
| ·在线(On Policy)学习和离线(Off Policy)学习 | 第33页 |
| ·分层增强式学习算法MAX-Q | 第33-37页 |
| ·分层学习结构 | 第34页 |
| ·分层学习方法 | 第34-35页 |
| ·分层学习的优点 | 第35-37页 |
| ·足球机器人系统的分层增强式学习结构及算法 | 第37-38页 |
| ·计算机仿真实验与结果分析 | 第38-39页 |
| ·本章小结 | 第39-41页 |
| 4 多智能体对抗系统 | 第41-49页 |
| ·对抗系统的特点 | 第41页 |
| ·对抗系统中策略的评价 | 第41-42页 |
| ·WOLF(Win or Learn Fast)学习法则 | 第42-46页 |
| ·应用变学习率法则的分层增强式学习算法 | 第46-47页 |
| ·计算机仿真实验与结果分析 | 第47-48页 |
| ·本章小结 | 第48-49页 |
| 5 总结与展望 | 第49-51页 |
| 致谢 | 第51-52页 |
| 参考文献 | 第52-54页 |