摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
1 绪论 | 第9-21页 |
1.1 论文研究背景 | 第9-11页 |
1.2 国内外研究现状 | 第11-16页 |
1.2.1 态势评估研究现状 | 第12-13页 |
1.2.2 集群智能决策研究现状 | 第13-15页 |
1.2.3 强化学习算法优化研究现状 | 第15-16页 |
1.3 论文研究目标和内容 | 第16-17页 |
1.3.1 论文研究目标 | 第16-17页 |
1.3.2 论文研究内容 | 第17页 |
1.4 论文组织结构安排 | 第17-21页 |
2 基于深度学习算法的态势评估模型研究 | 第21-49页 |
2.1 态势评估理论 | 第21-23页 |
2.2 常用的态势评估方法 | 第23-34页 |
2.2.1 基于模糊评判法的态势评估模型 | 第23-26页 |
2.2.2 基于线性拟合回归的态势评估模型 | 第26-30页 |
2.2.3 基于人工神经网络的态势评估模型 | 第30-34页 |
2.3 基于深度神经网络的态势评估网络模型 | 第34-41页 |
2.3.1 深度神经网络模型介绍 | 第35-38页 |
2.3.2 深度神经网络模型在态势评估系统中的应用 | 第38-39页 |
2.3.3 基于模糊原理的DL-SA改进模型 | 第39-41页 |
2.4 实验结果及分析 | 第41-47页 |
2.4.1 分类结果测试 | 第41-45页 |
2.4.2 态势评估验证 | 第45-47页 |
2.5 本章小结 | 第47-49页 |
3 基于人工逆强化学习算法的智能决策模型研究 | 第49-69页 |
3.1 智能决策理论 | 第49-51页 |
3.1.1 单智能体概念 | 第49-50页 |
3.1.2 多智能体概念 | 第50页 |
3.1.3 集群协同对抗决策理论 | 第50-51页 |
3.2 常用的集群协同对抗方法 | 第51-54页 |
3.2.1 基于分层决策树的集群协同对抗模型 | 第51-52页 |
3.2.2 基于动态最优角色分配的集群协同对抗模型 | 第52-54页 |
3.3 基于人工逆强化学习的集群协同对抗模型 | 第54-62页 |
3.3.1 强化学习模型介绍 | 第55-57页 |
3.3.2 人工强化学习在群体协同对抗系统中的应用 | 第57-59页 |
3.3.3 基于BP神经网络模型的HIRL-DM模型 | 第59-62页 |
3.4 实验结果及分析 | 第62-67页 |
3.4.1 人工强化学习合理性验证 | 第62-66页 |
3.4.2 复杂场景动态决策基本验证 | 第66-67页 |
3.5 本章小结 | 第67-69页 |
4 基于模糊控制理论的强化学习决策优化模型研究 | 第69-79页 |
4.1 基于二分理论的强化学习改进模型 | 第69-70页 |
4.2 基于模糊控制理论的强化学习改进模型 | 第70-75页 |
4.2.1 模糊控制理论 | 第70-71页 |
4.2.2 基于模糊控制理论的动态学习率调整 | 第71-75页 |
4.3 文章整体模型框架结构 | 第75页 |
4.4 实验结果及分析 | 第75-78页 |
4.4.1 FC-DLR视觉伺服实例验证 | 第75-77页 |
4.4.2 FC-DLR智能决策实例验证 | 第77-78页 |
4.5 本章小结 | 第78-79页 |
5 协同对抗平台实例验证 | 第79-89页 |
5.1 足球机器人协同对抗平台介绍 | 第79-83页 |
5.1.1 RoboCup3D仿真机器人系统 | 第80-82页 |
5.1.2 RoboCup标准机器人系统 | 第82-83页 |
5.2 仿真和实物实验验证 | 第83-88页 |
5.2.1 仿真平台整体性试验 | 第83-87页 |
5.2.2 实物平台整体性试验 | 第87-88页 |
5.3 本章小结 | 第88-89页 |
6 总结与展望 | 第89-91页 |
6.1 总结 | 第89-90页 |
6.2 展望 | 第90-91页 |
参考文献 | 第91-99页 |
发表论文及科研情况说明 | 第99-101页 |
致谢 | 第101-103页 |