首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于多Agent协作强化学习的研究

摘要第5-6页
Abstract第6页
插图索引第9-10页
附表索引第10-11页
第1章 绪论第11-17页
    1.1 选题的背景及意义第11-12页
    1.2 国内外研究现状第12-15页
        1.2.1 Agent研究现状第12-13页
        1.2.2 多Agent强化学习研究现状第13-15页
    1.3 论文的主要内容及结构第15-16页
        1.3.1 论文的主要内容第15页
        1.3.2 论文的组织结构第15-16页
    1.4 小结第16-17页
第2章 多Agent强化学习研究基础第17-29页
    2.1 强化学习概述第17-19页
        2.1.1 强化学习模型第17-18页
        2.1.2 马尔可夫决策过程第18-19页
    2.2 强化学习的常用算法第19-23页
        2.2.1 DP算法第20页
        2.2.2 MC算法第20-21页
        2.2.3 Q学习算法第21-23页
    2.3 强化学习研究中的常见问题第23页
    2.4 多Agent强化学习概述第23-28页
        2.4.1 多Agent强化学习简介第23-27页
        2.4.2 多Agent强化学习研究中常见问题第27-28页
    2.5 小结第28-29页
第3章 与本文相关研究工作第29-36页
    3.1 多Agent的信息共享方式第29-32页
    3.2 黑板模型第32-34页
    3.3 对手状态预测技术第34-35页
    3.4 小结第35-36页
第4章 基于追捕问题的多Agent协作方法的研究第36-49页
    4.1 追捕问题描述第36-38页
    4.2 改进的多Agent强化学习算法第38-46页
        4.2.1 算法框架第38-39页
        4.2.2 算法描述第39-40页
        4.2.3 算法说明第40-42页
        4.2.4 算法设计第42-46页
    4.3 实验结果及其分析第46-48页
    4.5 小结第48-49页
结论第49-51页
参考文献第51-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:国外真实发展指标(GPI)研究及其在我国的应用
下一篇:现代物流配送系统的研究与设计