0 前言 | 第1-8页 |
1 足球机器人及多智能体系统概述 | 第8-22页 |
·足球机器人比赛的出现 | 第8-9页 |
·多智能体系统的特性和研究内容 | 第9-11页 |
·多智能体系统的特性 | 第9-10页 |
·多智能体系统的研究内容 | 第10-11页 |
·多智能体系统的应用领域 | 第11-13页 |
·工业应用 | 第11-12页 |
·信息管理与商务应用 | 第12-13页 |
·医学应用 | 第13页 |
·娱乐应用 | 第13页 |
·足球机器人比赛 | 第13-14页 |
·RoboCup仿真足球机器人系统 | 第14-21页 |
·系统整体框架 | 第14-15页 |
·对象的运动 | 第15-16页 |
·碰撞 | 第16页 |
·风和环境干扰 | 第16页 |
·球员的动作 | 第16-17页 |
·球员的体力问题 | 第17-18页 |
·球员的感知信息 | 第18-21页 |
·仿真参数特点 | 第21页 |
·本章小结 | 第21-22页 |
2 足球机器人工作空间模糊建模 | 第22-32页 |
·模糊理论概述 | 第22-25页 |
·模糊的基本概念 | 第23-24页 |
·模糊集合与经典集合的联系 | 第24页 |
·模糊矩阵与模糊关系 | 第24-25页 |
·足球机器人状态空间的模糊表示 | 第25-30页 |
·仿真足球机器人球场环境概述 | 第25-26页 |
·从足球机器人系统中抽取的实验模型 | 第26-27页 |
·场上物体位置信息的模糊化 | 第27-30页 |
·输出的状态空间 | 第30页 |
·本章小结 | 第30-32页 |
3 分层增强式多智能体学习系统设计 | 第32-41页 |
·增强式学习概述 | 第32-33页 |
·增强式学习的基本要素 | 第32页 |
·Q-learning算法 | 第32-33页 |
·在线(On Policy)学习和离线(Off Policy)学习 | 第33页 |
·分层增强式学习算法MAX-Q | 第33-37页 |
·分层学习结构 | 第34页 |
·分层学习方法 | 第34-35页 |
·分层学习的优点 | 第35-37页 |
·足球机器人系统的分层增强式学习结构及算法 | 第37-38页 |
·计算机仿真实验与结果分析 | 第38-39页 |
·本章小结 | 第39-41页 |
4 多智能体对抗系统 | 第41-49页 |
·对抗系统的特点 | 第41页 |
·对抗系统中策略的评价 | 第41-42页 |
·WOLF(Win or Learn Fast)学习法则 | 第42-46页 |
·应用变学习率法则的分层增强式学习算法 | 第46-47页 |
·计算机仿真实验与结果分析 | 第47-48页 |
·本章小结 | 第48-49页 |
5 总结与展望 | 第49-51页 |
致谢 | 第51-52页 |
参考文献 | 第52-54页 |