首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于强化学习的多机器人协作机制研究

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-22页
   ·研究背景第10-11页
   ·多智能体机器人协作的研究综述第11-14页
   ·强化学习的发展与应用概况第14-18页
     ·强化学习的发展历史第14-16页
     ·强化学习的应用现状第16-18页
   ·强化学习在多智能体领域的应用情况第18-20页
     ·强化学习在多智能体机器人中的研究现状第18-19页
     ·有待解决的问题第19页
     ·解决问题的途径第19-20页
   ·本文研究内容及论文安排第20-22页
     ·研究内容第20页
     ·论文安排第20-22页
第二章 多智能体系统基本理论第22-34页
   ·智能体(Agent)的定义第22-23页
     ·Agent的弱定义第22-23页
     ·Agent的强定义第23页
   ·Agent的体系结构第23-27页
     ·Agent基本结构第24-25页
     ·慎思结构第25页
     ·反应结构第25-26页
     ·混合结构第26-27页
     ·BDI(Belief-Desire-Intention)结构第27页
   ·多智能体系统(Multi-Agent System,MAS)第27-33页
     ·多智能体系统的体系结构第28-30页
       ·集中式结构第28-29页
       ·分布式结构第29页
       ·混合式结构第29-30页
     ·多智能体系统协作方法第30-33页
       ·合同网第30-31页
       ·黑板模型第31页
       ·结果共享的协同方法第31-32页
       ·市场机制第32-33页
   ·小结第33-34页
第三章 强化学习理论及算法第34-49页
   ·强化学习介绍第34-37页
     ·强化学习的基本原理和模型第34-35页
     ·强化学习的特点第35-37页
   ·强化学习系统的组成要素第37-40页
   ·强化学习的主要算法第40-48页
     ·强化学习的目的第40-41页
     ·强化学习算法的类型第41-42页
     ·强化学习的主要算法第42-48页
   ·小结第48-49页
第四章 多智能体分布式两层强化学习协作方法第49-64页
   ·方法的提出第49-50页
   ·强化学习用于多智能体协作环境的方法第50-52页
     ·集中控制方法第50-51页
     ·分布式两层强化学习方法第51-52页
   ·基于两层分布式强化学习的多智能体协作第52-56页
     ·主要原理第52-53页
     ·分布式两层强化学习方法第53-56页
       ·智能体结构第53-55页
       ·两层强化学习算法第55-56页
   ·仿真实验及分析第56-62页
     ·实验场景第56-57页
     ·强化学习单元第57-59页
       ·环境状态空间和动作空间的表示第57-58页
       ·奖赏信号的设计第58页
       ·动作选择策略第58-59页
       ·Q值的学习与更新第59页
     ·实验结果与分析第59-62页
   ·小结第62-64页
第五章 基于行为预测的多智能体强化学习协作第64-79页
   ·方法的提出第64-65页
   ·基于预测的分布式强化学习算法第65-67页
     ·模型框架第65-66页
     ·算法描述及框架第66-67页
   ·行为预测方法第67-70页
     ·预测最大型第67-68页
     ·等概率预测型第68-69页
     ·基于分布律假设检验的最大预测型第69-70页
   ·仿真实验第70-77页
     ·实验场景第70-71页
     ·强化学习单元第71-72页
       ·环境状态空间和动作空间的表示第71页
       ·强化信号的设计第71页
       ·动作选择策略第71-72页
       ·Q值的学习与更新第72页
     ·实验结果与分析第72-76页
     ·基于分布律假设检验方法与分布式两层强化学习协作方法的比较第76-77页
   ·小结第77-79页
第六章 结束语第79-81页
参考文献第81-87页
攻读硕士学位期间参加科研项目与发表的学术论文第87-88页
致谢第88页

论文共88页,点击 下载论文
上一篇:法院调解制度的改革研究
下一篇:从翻译要求看中国文化遗产读本汉英翻译