首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于个性Agent的协作强化学习模型研究

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-21页
   ·问题的提出第9页
   ·研究内容、目的和创新点第9-10页
   ·课题的研究背景第10-20页
     ·协作模型研究现状第10-14页
     ·Agent的体系结构研究现状第14-17页
     ·强化学习研究现状第17-20页
   ·论文的组织结构第20-21页
第二章 个性Agent及其形式化描述第21-31页
   ·个性及思维状态第21-23页
     ·个性第21-22页
     ·Agent思维状态第22页
     ·多Agent思维状态第22-23页
   ·个性Agent的形式化描述第23-25页
   ·个性Agent活动第25-30页
     ·Agent个性特征的表达第26页
     ·依据个性特征决策第26-27页
     ·Agent行为效果的评价第27页
     ·个性Agent愿望的修正第27-28页
     ·个性Agent信念的修正第28-29页
     ·个性Agent规划的修正第29-30页
   ·本章小结第30-31页
第三章 基于个性的协作强化学习模型——CRLBP模型第31-45页
   ·角色第31-35页
     ·角色概念第31页
     ·个性与角色的关系第31-32页
     ·基本元素的描述第32-33页
     ·映射关系描述第33-35页
   ·协作第35-41页
     ·协作协议第35-38页
     ·协作学习第38-41页
   ·CRLBP模型第41-44页
     ·CRLBP模型的形式化描述第41-42页
     ·CRLBP模型工作过程第42-43页
     ·CRLBP模型有效性分析第43-44页
   ·本章小结第44-45页
第四章 CRLBP模型在RoboCup中的应用第45-57页
   ·RoboCup背景介绍第45-47页
     ·研究RoboCup的意义第45页
     ·RoboCup与多Agent系统第45-46页
     ·RoboCup3D系统结构第46-47页
   ·3D球队的设计与实现第47-51页
     ·球员的动作与感知模型第47-48页
     ·球队策略与阵型第48-49页
     ·球队中的角色的作用第49-50页
     ·球队中的球员的代码设计第50-51页
   ·CRLBP的决策过程第51-54页
     ·个性Agent愿望偏好第51-52页
     ·个性Agent的决策第52页
     ·个性Agent行为效果评价第52-54页
     ·多个性Agent的协作第54页
   ·实验结果与分析第54-56页
     ·CRLBP在截球中的应用第55页
     ·CRLBP在传球中的应用第55-56页
     ·实验结果分析第56页
   ·本章小结第56-57页
第五章 结论与展望第57-59页
   ·工作总结第57页
   ·下一步工作展望第57-59页
参考文献第59-61页
致谢第61-62页
发表文章及获奖情况第62页

论文共62页,点击 下载论文
上一篇:移动机器人混合路径规划算法研究
下一篇:定性空间表示和推理及其在定性导航中应用的研究