摘要 | 第8-9页 |
ABSTRACT | 第9页 |
第1章 绪论 | 第10-16页 |
1.1 研究背景 | 第10-11页 |
1.2 国内外研究概况 | 第11-13页 |
1.3 论文组织结构 | 第13-16页 |
第2章 基于大面积停电的应急兵棋推演模型 | 第16-28页 |
2.1 兵棋推演的概念 | 第16页 |
2.2 兵棋场景的基本构成 | 第16-17页 |
2.3 基于大面积停电应急抢修兵棋模型 | 第17-18页 |
2.4 界面显示层及各要素建模 | 第18-26页 |
2.4.1 棋子模型 | 第19-22页 |
2.4.2 地图模型 | 第22-25页 |
2.4.3 兵棋规则 | 第25-26页 |
2.4.4 兵棋想定 | 第26页 |
2.5 本章总结 | 第26-28页 |
第3章 基于行为树的兵棋决策模型 | 第28-38页 |
3.1 行为树的概念 | 第28页 |
3.2 行为树节点 | 第28-34页 |
3.2.1 叶子节点 | 第29-30页 |
3.2.2 组合节点 | 第30-34页 |
3.3 行为树的优点 | 第34页 |
3.4 构建大面积停电应急管理行为树 | 第34-37页 |
3.5 本章总结 | 第37-38页 |
第4章 基于强化学习的决策生成优化算法 | 第38-58页 |
4.1 强化学习 | 第38页 |
4.2 Q-learning算法介绍 | 第38-41页 |
4.3 Sarsa算法介绍 | 第41页 |
4.4 Sarsa算法与Q-leaning算法比较 | 第41-43页 |
4.5 基于Sarsa算法的行为树构建 | 第43-51页 |
4.5.1 算法设计 | 第43-45页 |
4.5.2 状态集合与动作集合 | 第45-47页 |
4.5.3 Reward函数 | 第47-51页 |
4.6 应急抢修事件决策优化 | 第51-56页 |
4.7 本章总结 | 第56-58页 |
第5章 结论与展望 | 第58-60页 |
5.1 结论 | 第58-59页 |
5.2 展望 | 第59-60页 |
参考文献 | 第60-64页 |
致谢 | 第64-65页 |
攻读学位期间发表的科研成果目录 | 第65-66页 |
学位论文评阅及答辩情况表 | 第66页 |