机器学习在多Agent系统控制决策中的应用研究

0 前言	第1-13页
1 机器学习算法与多Agent系统	第13-18页
·机器学习算法	第13-14页
·多Agent系统控制决策模型	第14-15页
·国内外研究现状和研究内容	第15-17页
·在多Agent系统中使用机器学习算法	第17页
·小结	第17-18页
2 基于范例的观察学习(MBL)	第18-23页
·观察学习的定义	第18-20页
·观察学习与其他机器学习算法的关系	第20页
·观察学习的应用举例—足球机器人系统中守门员决策控制的训练	第20-22页
·RoboCup足球机器人简介	第20-22页
·应用分析	第22页
·结论	第22-23页
3 基于聚类的数据预处理算法	第23-34页
·训练数据中的噪声对有施教者的机器学习算法的影响	第23-24页
·CDPA描述	第24-28页
·数据定义	第24页
·算法原理和描述	第24-25页
·算法主要部分形式化描述	第25-28页
·CDPA特点	第28-31页
·基本要求	第28页
·参数选择和作用	第28-29页
·向量标准化问题	第29-30页
·通用性	第30页
·实用性	第30-31页
·算法复杂度分析	第31-32页
·时间复杂度分析	第31页
·空间复杂度分析	第31-32页
·算法效果实验验证	第32页
·结论	第32-34页
4 潜在角色值方法	第34-48页
·增强式学习方法	第34-41页
·马尔可夫决策过程(Markov Decision Process，简称为MDP)	第34-35页
·增强式学习(Reinforcement Learning)	第35-37页
·增强式学习的要素	第37-40页
·增强式学习的过程	第40-41页
·潜在角色值方法的定义和存在背景	第41-42页
·方法描述	第42-47页
·潜在角色值与Agent的行为决策	第42-44页
·系统与多个Agent的潜在角色值的整体调整	第44-45页
·潜在角色值方法在RoboCup仿真系统中的应用实例	第45-47页
·结论	第47-48页
5 总结与展望	第48-49页
致谢	第49-50页
参考文献	第50-55页
作者论文发表情况	第55页