多智能体强化学习研究

致谢	第3-4页
摘要	第4-6页
Abstract	第6-7页
1 绪论	第14-18页
1.1 课题来源	第14页
1.2 研究背景及意义	第14-15页
1.3 国内外研究现状	第15-16页
1.4 本文主要工作	第16-17页
1.5 论文组织结构	第17-18页
2 相关工作	第18-31页
2.1 强化学习	第18-19页
2.2 多智能体强化学习	第19-22页
2.3 多智能体深度强化学习	第22-28页
2.4 多智能体强化学习的应用	第28-30页
2.5 本章小结	第30-31页
3 基于多智能体深度确定性策略梯度的算法	第31-38页
3.1 多智能体深度确定性策略梯度算法	第31-32页
3.2 多智能体双重深度确定性策略梯度算法	第32-34页
3.3 实验结果及其分析	第34-37页
3.4 本章小结	第37-38页
4 基于改进的并行粒子群算法的异步强化学习算法	第38-51页
4.1 改进的并行粒子群算法	第38-40页
4.2 APSO-BQSA算法	第40-41页
4.3 APSO算法的实验	第41-47页
4.4 APSO-BQSA算法的实验	第47-50页
4.5 本章小结	第50-51页
5 总结和展望	第51-53页
5.1 总结	第51-52页
5.2 展望	第52-53页
参考文献	第53-59页
作者简历	第59-61页
学位论文数据集	第61页