首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于强化学习的多机器人协作研究

摘要第1-8页
Abstract第8-9页
附图索引第9-10页
附表索引第10-11页
第1章 绪论第11-19页
   ·课题的研究意义第11-12页
   ·国内外研究现状第12-17页
     ·多机器人系统的发展现状第12-15页
     ·强化学习的发展现状第15页
     ·基于强化学习的多机器人协作的发展现状第15-17页
   ·本文的主要内容和各章节安排第17-19页
第2章 多机器人协作的研究内容第19-26页
   ·多机器人协作与协调第19-20页
     ·多机器人协作与协调的描述第19页
     ·多机器人协作与协调之间的关系第19-20页
   ·多机器人协作的分类方式第20-22页
     ·根据群体特征的分类方式第20页
     ·根据多机器人系统的协作的分类方式第20-22页
   ·多机器人协作的研究方法第22-23页
     ·协商与反应式方法第22页
     ·分布式人工智能第22-23页
     ·学习与进化方法第23页
   ·协作机器人学研究的主要问题及应用领域第23-25页
     ·协作机器人学的研究内容第23-24页
     ·多机器人协作的应用领域第24-25页
   ·本章小结第25-26页
第3章 强化学习第26-35页
   ·强化学习介绍第26-28页
     ·强化学习的原理与模型第26-27页
     ·学习系统的类型第27-28页
   ·强化学习的组成要素第28-29页
   ·强化学习的主要算法第29-33页
     ·蒙特卡罗算法(Monte Carlo method)第29-30页
     ·时序差分算法(temporal difference)第30-32页
     ·Q学习算法第32-33页
     ·Sarsa 学习算法第33页
   ·本章小结第33-35页
第4章 基于动作预测的强化学习在多机器人协作中的应用第35-47页
   ·引言第35页
   ·动作预测第35-36页
   ·基于动作预测的强化学习算法第36-40页
     ·多机器人预测强化学习的模型框架第36-37页
     ·算法的描述第37-38页
     ·算法的框架第38-39页
     ·概率预测函数第39-40页
   ·仿真实验第40-46页
     ·实验设置第40-41页
     ·强化学习单元第41-43页
     ·实验结果与分析第43-46页
   ·本章小结第46-47页
第5章 动态环境中的多机器人协同搬运第47-56页
   ·引言第47页
   ·Q ( )学习算法第47-48页
   ·基于Q学习的 BDI 协作模型第48-51页
     ·基于权重的行为机制第50页
     ·基于Q学习的行为权重第50-51页
     ·距离最近原则第51页
   ·仿真实验第51-55页
     ·实验场景第51页
     ·强化学习单元第51-53页
     ·实验结果与分析第53-55页
   ·本章小结第55-56页
结论与展望第56-57页
参考文献第57-61页
致谢第61-62页
附录A 攻读硕士学位期间参与的科研项目与发表的学术论文第62页

论文共62页,点击 下载论文
上一篇:理工科院校校园文化建设探究--以兰州理工大学为例
下一篇:锰粉制备输送控制系统设计与研究