“空中牧羊犬行动”驱赶策略算法设计与研究

摘要	第5-6页
ABSTRACT	第6-7页
符号对照表	第11-12页
缩略语对照表	第12-15页
第一章绪论	第15-23页
1.1 项目背景和研究意义	第15-16页
1.2 国内外研究现状	第16-20页
1.2.1 无人机任务规划技术的研究现状	第16-17页
1.2.2 强化学习的研究现状	第17-20页
1.3 主要工作内容	第20页
1.4 论文结构	第20-23页
第二章仿真平台介绍	第23-31页
2.1 比赛规则说明	第23-25页
2.2 比赛场景建立	第25-28页
2.3 仿真流程说明	第28-30页
2.4 本章小结	第30-31页
第三章全局驱赶算法设计和仿真	第31-45页
3.1 全局驱赶算法设计	第31-34页
3.1.1 总体设计思路	第31-32页
3.1.2 算法流程图	第32-34页
3.2 主要函数说明	第34-35页
3.3 全局驱赶算法实现	第35-37页
3.4 仿真实验	第37-44页
3.4.1 实验说明	第37-38页
3.4.2 实验结果与分析	第38-44页
3.5 本章小结	第44-45页
第四章局部驱赶算法设计和仿真	第45-59页
4.1 局部驱赶算法设计	第45-47页
4.1.1 总体设计思路	第45-46页
4.1.2 算法流程图	第46-47页
4.2 主要函数说明	第47-50页
4.2.1 仿真序列更新	第47-49页
4.2.2 预测地面机器人运动状态	第49-50页
4.3 空中机器人状态调度	第50-52页
4.4 仿真实验	第52-57页
4.4.1 实验说明	第52页
4.4.2 实验结果与分析	第52-57页
4.5 本章小结	第57-59页
第五章学习型驱赶算法设计和仿真	第59-77页
5.1 强化学习算法介绍	第59-64页
5.1.1 探索和利用	第59-60页
5.1.2 无模型学习	第60-64页
5.2 学习型驱赶算法设计	第64-69页
5.2.1 总体设计思路	第64-65页
5.2.2 状态空间的离散化	第65-66页
5.2.3 状态表和状态-动作值表	第66页
5.2.4 策略选择和奖赏函数	第66-68页
5.2.5 学习型驱赶算法流程	第68-69页
5.3 学习型驱赶算法实现	第69-70页
5.4 仿真实验	第70-76页
5.4.1 实验说明	第70页
5.4.2 实验结果和分析	第70-74页
5.4.3 局部驱赶算法和学习型驱赶算法对比	第74-76页
5.5 本章小结	第76-77页
第六章总结和展望	第77-79页
6.1 工作总结	第77页
6.2 未来展望	第77-79页
参考文献	第79-81页
致谢	第81-83页
作者简介	第83-84页