首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于免模型强化学习的自适应Agent协作规划

摘要第5-6页
Abstract第6-7页
第1章 绪论第10-20页
    1.1 研究背景及意义第10-12页
    1.2 研究现状第12-19页
        1.2.1 单Agent系统规划第12-15页
        1.2.2 多Agent系统协作第15-19页
    1.3 论文组织结构第19-20页
第2章 相关概念及技术第20-30页
    2.1 BDI Agent模型第20-23页
    2.2 过程推理系统PRS第23-24页
    2.3 逻辑编程语言Prolog第24-25页
    2.4 强化学习和Q-learning第25-27页
    2.5 基于社会角色的多Agent协作第27-29页
    2.6 小结第29-30页
第3章 不确定环境下ASL最优策略规划第30-46页
    3.1 ASL模型第30-38页
        3.1.1 ASL模型的结构描述第30-36页
        3.1.2 ASL模型的规划算法第36-38页
    3.2 基于ASL模型的规划算法的改进第38-40页
    3.3 基于RCRSS平台救援场景的建模方法验证第40-44页
        3.3.1 救援场景描述第40-41页
        3.3.2 救援场景的ASL建模第41-44页
    3.4 小结第44-46页
第4章 基于Ja Ca Mo模型的角色分配任务最优规划第46-54页
    4.1 Ja Ca Mo模型第46-48页
    4.2 基于广播机制的角色分配任务算法第48-51页
    4.3 基于RCRSS平台的多Agent协作建模方法验证第51-53页
        4.3.1 协作救火场景描述第51页
        4.3.2 协作救火场景的Ja Ca Mo建模第51-53页
    4.4 小结第53-54页
第5章 实验设计与结果分析第54-66页
    5.1 机器人救援仿真系统RCRSS第54-59页
        5.1.1 RCRSS的构成第54-57页
        5.1.2 RCRSS的执行过程第57-58页
        5.1.3 仿真环境介绍第58-59页
    5.2 实验结果分析第59-65页
        5.2.1 ASL最优策略算法的实验设计与分析第59-62页
        5.2.2 角色分配任务最优算法实验设计与分析第62-65页
    5.3 小结第65-66页
第6章 总结与展望第66-68页
参考文献第68-74页
攻读硕士期间已发表的论文第74-76页
致谢第76-77页

论文共77页,点击 下载论文
上一篇:基于数据挖掘的税务稽查选案研究
下一篇:多孔石墨烯的制备及其在超级电容器中的应用研究