0 前言 | 第1-13页 |
1 机器学习算法与多Agent系统 | 第13-18页 |
·机器学习算法 | 第13-14页 |
·多Agent系统控制决策模型 | 第14-15页 |
·国内外研究现状和研究内容 | 第15-17页 |
·在多Agent系统中使用机器学习算法 | 第17页 |
·小结 | 第17-18页 |
2 基于范例的观察学习(MBL) | 第18-23页 |
·观察学习的定义 | 第18-20页 |
·观察学习与其他机器学习算法的关系 | 第20页 |
·观察学习的应用举例—足球机器人系统中守门员决策控制的训练 | 第20-22页 |
·RoboCup足球机器人简介 | 第20-22页 |
·应用分析 | 第22页 |
·结论 | 第22-23页 |
3 基于聚类的数据预处理算法 | 第23-34页 |
·训练数据中的噪声对有施教者的机器学习算法的影响 | 第23-24页 |
·CDPA描述 | 第24-28页 |
·数据定义 | 第24页 |
·算法原理和描述 | 第24-25页 |
·算法主要部分形式化描述 | 第25-28页 |
·CDPA特点 | 第28-31页 |
·基本要求 | 第28页 |
·参数选择和作用 | 第28-29页 |
·向量标准化问题 | 第29-30页 |
·通用性 | 第30页 |
·实用性 | 第30-31页 |
·算法复杂度分析 | 第31-32页 |
·时间复杂度分析 | 第31页 |
·空间复杂度分析 | 第31-32页 |
·算法效果实验验证 | 第32页 |
·结论 | 第32-34页 |
4 潜在角色值方法 | 第34-48页 |
·增强式学习方法 | 第34-41页 |
·马尔可夫决策过程(Markov Decision Process,简称为MDP) | 第34-35页 |
·增强式学习(Reinforcement Learning) | 第35-37页 |
·增强式学习的要素 | 第37-40页 |
·增强式学习的过程 | 第40-41页 |
·潜在角色值方法的定义和存在背景 | 第41-42页 |
·方法描述 | 第42-47页 |
·潜在角色值与Agent的行为决策 | 第42-44页 |
·系统与多个Agent的潜在角色值的整体调整 | 第44-45页 |
·潜在角色值方法在RoboCup仿真系统中的应用实例 | 第45-47页 |
·结论 | 第47-48页 |
5 总结与展望 | 第48-49页 |
致谢 | 第49-50页 |
参考文献 | 第50-55页 |
作者论文发表情况 | 第55页 |