首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于RoboCup多智能体系统学习与协作问题的研究

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-16页
   ·引言第8页
   ·智能Agent第8-10页
     ·Agent与环境第8-9页
     ·Agent属性第9页
     ·Agent结构分类第9-10页
   ·多Agent系统及其研究内容第10-12页
   ·RoboCup的研究概况第12-14页
     ·RoboCup背景及意义第12-13页
     ·RoboCup比赛及仿真环境第13-14页
     ·国内外的研究概况第14页
   ·论文的主要工作第14-16页
第二章 RoboCup中的学习技术第16-26页
   ·BP神经网络理论第16-18页
     ·BP神经网络结构第16-17页
     ·BP算法基本原理第17页
     ·BP算法的工作原理第17-18页
   ·遗传算法第18-20页
     ·遗传算法的基本要素第18-19页
     ·遗传算法的工作原理第19-20页
   ·强化学习第20-23页
     ·强化学习原理第20-21页
     ·马尔可夫决策过程(Markov Decision Process)模型第21-22页
     ·强化学习中的几个关键概念第22-23页
   ·Q学习第23-25页
     ·Q学习原理第24页
     ·Q学习的基本算法第24-25页
   ·本章小结第25-26页
第三章 基于层结构的Agent框架研究第26-36页
   ·AFU2007的结构设计第26-30页
     ·Agent的结构设计需求第26页
     ·Agent层结构设计框架第26-28页
     ·AFU2007层结构的模块化实现第28-29页
     ·协调和紧急处理模块的实现第29-30页
   ·基于分层学习的Agent决策框架第30-32页
     ·决策框架的提出第30-31页
     ·决策框架的结构第31-32页
   ·自底向上的学习过程第32-34页
     ·基本技术的学习第32-33页
     ·个体策略的学习第33-34页
     ·球队策略的学习第34页
   ·自顶向下的决策过程第34页
   ·学习决策框架中存在的问题第34-35页
   ·本章小结第35-36页
第四章 Agent个体技术的实现研究第36-50页
   ·截球(interceptive)技术的BP_GA算法第36-45页
     ·问题描述第36-37页
     ·二分法求解第37-39页
     ·截球(interceptive)的BP_GA算法求解第39-43页
     ·BP_GA算法与纯BP算法的对比实验第43-44页
     ·DP_GA算法与二分法求解的对比第44-45页
   ·踢球(Kick)的Q学习第45-49页
     ·问题描述第45页
     ·踢球(kick)技术的Q学习实现第45-48页
     ·实验与评价第48-49页
   ·本章小结第49-50页
第五章 Agent群体协作的Q学习研究第50-62页
   ·多AgentQ学习第50-55页
     ·基于Markov对策框架的多Agent强化学习框架第50-51页
     ·基于统计的多Agent Q学习思想第51页
     ·多Agent Q学习算法第51-52页
     ·算法收敛性证明第52-55页
   ·学习算法在RoboCup进攻决策中的应用第55-61页
     ·问题引入第55-56页
     ·Agnet团队进攻策略的强化学习第56-57页
     ·进攻决策的Q学习模型第57-60页
     ·实验与讨论第60-61页
   ·本章小结第61-62页
第六章 结束语第62-63页
   ·本文工作总结第62页
   ·下一步的工作第62-63页
致谢第63-64页
参考文献第64-67页
附录:作者在攻读硕士学位期间发表的论文第67页

论文共67页,点击 下载论文
上一篇:RoboCup小型组决策与路径规划研究
下一篇:基于ARM的电网谐波检测与分析系统的研究