基于深度强化学习的多智能体协同算法研究

致谢	第3-4页
摘要	第4-5页
abstract	第5-6页
1 绪论	第14-20页
1.1 研究背景与意义	第14-15页
1.2 国内外研究现状	第15-17页
1.3 本文研究内容	第17-18页
1.4 本文组织结构	第18-20页
2 深度强化学习和多智能体基础	第20-28页
2.1 强化学习	第20-22页
2.2 深度强化学习	第22-26页
2.3 多智能体深度强化学习	第26-27页
2.4 本章小结	第27-28页
3 基于最大熵的多智能体深度强化学习	第28-50页
3.1 引言	第28-29页
3.2 Soft Actor-Critic简介	第29-30页
3.3 集中训练和分散执行框架	第30-31页
3.4 基于最大熵的多智能体深度强化学习	第31-34页
3.5 基于通信设备的MASAC通信模型	第34-39页
3.6仿真实验	第39-49页
3.7 本章小结	第49-50页
4 基于自注意力机制的多智能体深度强化学习	第50-62页
4.1 引言	第50-51页
4.2 注意力机制和自注意力机制	第51-52页
4.3 基于自注意力机制的多智能体深度强化学习	第52-55页
4.4仿真实验	第55-61页
4.5 本章小结	第61-62页
5 总结和展望	第62-64页
5.1 工作总结	第62页
5.2 未来展望	第62-64页
参考文献	第64-70页
作者简历	第70-72页
学位论文数据集	第72页