首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于强化学习的应急任务动态规划研究

摘要第1-5页
Abstract第5-8页
1 绪论第8-15页
   ·课题来源第8页
   ·研究背景、目的及意义第8-9页
   ·国内外研究现状第9-13页
   ·本文研究内容第13-14页
   ·本文组织结构第14-15页
2 强化学习相关理论和方法第15-24页
   ·马尔可夫决策过程第15-16页
   ·强化学习系统的结构模型第16-17页
   ·强化学习系统的基本要素第17-18页
   ·瞬时差分算法第18页
   ·Q 学习第18-20页
   ·分层强化学习算法第20-24页
3 基于 option 的应急救援任务模型第24-49页
   ·应急救援任务环境概述第24-28页
   ·应急救援任务模型第28-36页
   ·基于 Q 学习的任务分配策略第36-40页
   ·基于 Option 的任务分配策略第40-48页
   ·本章小结第48-49页
4 算例研究第49-58页
   ·案例介绍第49页
   ·仿真环境及参数设置第49-51页
   ·仿真结果第51-57页
   ·本章小结第57-58页
5 总结与展望第58-60页
   ·总结第58-59页
   ·展望第59-60页
致谢第60-61页
参考文献第61-65页
附录 1 攻读学位期间发表的学术论文第65-66页
附录 2 攻读学位期间参与的科研项目第66页

论文共66页,点击 下载论文
上一篇:基于HTN的应急任务规划方法与应用
下一篇:新型农村养老保险制度对家庭养老的影响研究--基于对河南省M村的调查