首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

多智能体博弈强化学习算法及其均衡研究

摘要第3-4页
ABSTRACT第4-5页
1 绪论第8-13页
    1.1 选题背景及研究意义第8-9页
        1.1.1 选题背景第8-9页
        1.1.2 研究意义第9页
    1.2 研究现状及发展趋势第9-11页
        1.2.1 多智能体强化学习的研究现状及发展趋势第9-10页
        1.2.2 博弈均衡的研究现状及发展趋势第10-11页
    1.3 本文研究内容和技术路线第11-13页
        1.3.1 研究内容第11-12页
        1.3.2 技术路线第12-13页
2 相关基本理论第13-23页
    2.1 强化学习第13-16页
        2.1.1 强化学习模型与基本要素第13-14页
        2.1.2 马尔科夫决策过程概述第14-16页
    2.2 多智能体强化学习第16-19页
        2.2.1 多智能体强化学习模型第16-17页
        2.2.2 马尔科夫博弈中的多智能体强化学习第17-19页
    2.3 博弈均衡理论第19-22页
        2.3.1 纳什均衡的数学描述第19-20页
        2.3.2 纯策略博弈第20页
        2.3.3 混合策略博弈第20-22页
    2.4 小结第22-23页
3 参数逼近的多智能体强化学习算法第23-35页
    3.1 多智能体纳什Q学习第23-26页
        3.1.1 策略迭代与时间差分学习第23-25页
        3.1.2 纳什Q学习算法第25-26页
    3.2 基于参数逼近的强化学习算法第26-28页
        3.2.1 算法改进第26-27页
        3.2.2 算法描述第27-28页
    3.3 算法的收敛性与可行性分析第28-31页
        3.3.1 算法收敛性分析第28-30页
        3.3.2 算法可行性分析第30-31页
    3.4 实验与结果分析第31-34页
        3.4.1 实验设置第31-32页
        3.4.2 结果分析第32-34页
    3.5 本章小结第34-35页
4 基于粒子群算法求解纳什均衡第35-51页
    4.1 纳什均衡问题转化第35-38页
        4.1.1 双人策略博弈中的纳什均衡第35-36页
        4.1.2 双人策略博弈的优化问题第36-38页
    4.2 改进的粒子群算法设计思想第38-44页
        4.2.1 标准粒子群算法思想第38-39页
        4.2.2 参数的分析与修正第39-41页
        4.2.3 改进的粒子群算法步骤第41-42页
        4.2.4 数值测试第42-44页
    4.3 改进的粒子群算法求解纳什均衡第44-47页
        4.3.1 求解纳什均衡优化模型第44-46页
        4.3.2 算法描述第46-47页
        4.3.3 算法流程图第47页
        4.3.4 算法可行性分析与性能评价第47页
    4.4 仿真算例第47-50页
    4.5 本章小结第50-51页
5 结论与展望第51-53页
    5.1 结论第51页
    5.2 展望第51-53页
致谢第53-54页
参考文献第54-58页
附录第58页
攻读硕士学位期间获奖第58页

论文共58页,点击 下载论文
上一篇:文化指示语及其主体间的表达探索
下一篇:现代性的因缘--《红楼梦》在日编译本接受研究