| 0 前言 | 第1-13页 |
| 1 机器学习算法与多Agent系统 | 第13-18页 |
| ·机器学习算法 | 第13-14页 |
| ·多Agent系统控制决策模型 | 第14-15页 |
| ·国内外研究现状和研究内容 | 第15-17页 |
| ·在多Agent系统中使用机器学习算法 | 第17页 |
| ·小结 | 第17-18页 |
| 2 基于范例的观察学习(MBL) | 第18-23页 |
| ·观察学习的定义 | 第18-20页 |
| ·观察学习与其他机器学习算法的关系 | 第20页 |
| ·观察学习的应用举例—足球机器人系统中守门员决策控制的训练 | 第20-22页 |
| ·RoboCup足球机器人简介 | 第20-22页 |
| ·应用分析 | 第22页 |
| ·结论 | 第22-23页 |
| 3 基于聚类的数据预处理算法 | 第23-34页 |
| ·训练数据中的噪声对有施教者的机器学习算法的影响 | 第23-24页 |
| ·CDPA描述 | 第24-28页 |
| ·数据定义 | 第24页 |
| ·算法原理和描述 | 第24-25页 |
| ·算法主要部分形式化描述 | 第25-28页 |
| ·CDPA特点 | 第28-31页 |
| ·基本要求 | 第28页 |
| ·参数选择和作用 | 第28-29页 |
| ·向量标准化问题 | 第29-30页 |
| ·通用性 | 第30页 |
| ·实用性 | 第30-31页 |
| ·算法复杂度分析 | 第31-32页 |
| ·时间复杂度分析 | 第31页 |
| ·空间复杂度分析 | 第31-32页 |
| ·算法效果实验验证 | 第32页 |
| ·结论 | 第32-34页 |
| 4 潜在角色值方法 | 第34-48页 |
| ·增强式学习方法 | 第34-41页 |
| ·马尔可夫决策过程(Markov Decision Process,简称为MDP) | 第34-35页 |
| ·增强式学习(Reinforcement Learning) | 第35-37页 |
| ·增强式学习的要素 | 第37-40页 |
| ·增强式学习的过程 | 第40-41页 |
| ·潜在角色值方法的定义和存在背景 | 第41-42页 |
| ·方法描述 | 第42-47页 |
| ·潜在角色值与Agent的行为决策 | 第42-44页 |
| ·系统与多个Agent的潜在角色值的整体调整 | 第44-45页 |
| ·潜在角色值方法在RoboCup仿真系统中的应用实例 | 第45-47页 |
| ·结论 | 第47-48页 |
| 5 总结与展望 | 第48-49页 |
| 致谢 | 第49-50页 |
| 参考文献 | 第50-55页 |
| 作者论文发表情况 | 第55页 |