RoboCup仿真比赛环境下多智能体系统设计及其学习问题研究

摘要	第1-7页
ABSTRACT	第7-8页
第一章绪论	第8-15页
·研究背景	第8-9页
·多智能体系统(MAS) 结构	第9-11页
·慎思结构	第10页
·反应结构	第10页
·混合结构	第10-11页
·RoboCup环境中的学习问题	第11-12页
·RoboCup活动及比赛历史	第12-14页
·国际RoboCup比赛情况	第13页
·国内RoboCup比赛情况	第13-14页
·本论文的主要工作	第14-15页
第二章 RoBoCup仿真环境模型	第15-31页
·RoboCup仿真比赛环境简介	第15-16页
·整场比赛的过程	第16-17页
·SoccerServer重要参数	第17-19页
·SoccerServer的运行机制	第19-30页
·SoccerServer中的对象	第19-20页
·场地和球员	第20页
·对象的运动	第20-21页
·碰撞	第21页
·风和环境干扰	第21-22页
·球员的动作	第22-24页
·球员的体力问题	第24-25页
·球员的感知信息	第25-30页
·本章小结	第30-31页
第三章 AFU2003 Agent结构	第31-40页
·AFU2003 Agent结构	第31-33页
·AFU2003 Agent各层介绍	第33-40页
·通迅层	第33-34页
·基本动作层	第34页
·可选动作评价层	第34-35页
·决策层	第35页
·世界模型	第35-40页
第四章球员决策技术	第40-52页
·传球模块设计	第40-42页
·带球模块设计	第42-46页
·势场的描述	第42-43页
·规划中的子目标	第43-45页
·算法描述	第45-46页
·点球模块设计	第46-52页
第五章阵形变换方法及基于阵形变换的防守模块设计	第52-61页
·本位点及角色的定义	第52-53页
·基本阵形	第53-54页
·变换阵形	第54-55页
·阵形的动态切换	第55-58页
·实验验证	第58页
·基于阵形变换的防守模块	第58-60页
·防守模块实战效果及问题	第60-61页
第六章 Coach设计及异构球员的实现	第61-68页
·在线教练的结构及系统实现	第61-63页
·球员异构	第63-64页
·异构球员类型的选择	第64-66页
·形势分析层设计	第66-67页
·比赛效果测试	第67-68页
第七章 Robocup仿真比赛中基于Q学习的射门模块研究	第68-78页
·Markov决策过程与再励学习算法	第68-74页
·Markov决策过程	第68-70页
·再励学习	第70-71页
·Q学习算法	第71-72页
·模糊Q学习算法	第72-74页
·基于Q学习的射门模块研究	第74-77页
·问题的提出	第74-75页
·基于Q学习的射门新方法	第75-77页
·结论	第77-78页
第八章基于L-M BP算法的AFU2003神经网络训练测试工具设计	第78-88页
·Levenberg-Marquardt BP算法	第79-83页
·基于L-M BP算法的神经网络训练器设计	第83-86页
·仿真测试	第86-88页
第九章总结及下一步的工作	第88-90页
·比赛成绩	第88-89页
·进一步的研究工作	第89-90页
致谢	第90-91页
参考文献	第91-95页
攻读硕士学位期间发表的论文清单	第95页