空中机器人的层次化决策与控制系统研究
| 致谢 | 第5-7页 |
| 摘要 | 第7-9页 |
| Abstract | 第9-11页 |
| 缩写清单、术语表 | 第17-23页 |
| 1 绪论 | 第23-35页 |
| 1.1 研究对象、背景及意义 | 第23-24页 |
| 1.2 空中机器人发展现状 | 第24-27页 |
| 1.3 国际空中机器人大赛 | 第27-31页 |
| 1.4 论文研究内容及结构 | 第31-35页 |
| 2 空中机器人对地面移动目标拦截的实时轨迹规划 | 第35-61页 |
| 2.1 引言 | 第35-37页 |
| 2.2 问题描述 | 第37-40页 |
| 2.3 二次型动态规划 | 第40-46页 |
| 2.4 分段式轨迹规划 | 第46-48页 |
| 2.5 仿真 | 第48-54页 |
| 2.6 实物实验 | 第54-58页 |
| 2.7 总结 | 第58-61页 |
| 3 基于神经网络建模补偿的滤波与预测算法 | 第61-79页 |
| 3.1 引言 | 第61-63页 |
| 3.2 深度数据同化 | 第63-67页 |
| 3.3 双积分质点系统仿真 | 第67-71页 |
| 3.4 洛伦兹系统仿真 | 第71-77页 |
| 3.5 总结 | 第77-79页 |
| 4 可视化仿真环境设计及时间预测实验 | 第79-91页 |
| 4.1 引言 | 第79-80页 |
| 4.2 设计初衷 | 第80-82页 |
| 4.3 仿真系统设计 | 第82-87页 |
| 4.4 时间预测模型仿真实验 | 第87-90页 |
| 4.5 总结 | 第90-91页 |
| 5 基于马尔可夫决策过程的决策算法研究 | 第91-111页 |
| 5.1 引言 | 第91-92页 |
| 5.2 任务的数学表述 | 第92-95页 |
| 5.3 问题构建 | 第95-100页 |
| 5.4 求解方法 | 第100-103页 |
| 5.5 仿真实验 | 第103-107页 |
| 5.6 总结 | 第107-111页 |
| 6 连续时间离散动作的强化学习研究 | 第111-129页 |
| 6.1 引言 | 第111-115页 |
| 6.2 背景知识 | 第115-117页 |
| 6.3 算法 | 第117-121页 |
| 6.4 雅达利乒乓球 | 第121-125页 |
| 6.5 牧羊犬行动 | 第125-126页 |
| 6.6 总结 | 第126-129页 |
| 7 总结与展望 | 第129-133页 |
| 7.1 全文工作总结 | 第129-130页 |
| 7.2 未来工作展望 | 第130-133页 |
| 参考文献 | 第133-143页 |
| 附录A: 带动作时间的Q学习收敛性分析 | 第143-151页 |
| 作者简历 | 第151-153页 |
| 攻读博士学位期间科研成果 | 第153-154页 |