首页--天文学、地球科学论文--地球物理学论文--大地(岩石界)物理学(固体地球物理学)论文--地震学论文--工程地震论文

基于Q学习的震后救援路径寻优算法研究

摘要第1-5页
Abstract第5-10页
第一章 绪论第10-18页
   ·研究背景及意义第10-13页
   ·地震灾害的特点第13-14页
   ·国内外研究现状第14-15页
   ·论文研究内容第15-16页
   ·技术路线第16-18页
第二章 城市震后路网可靠性分析第18-24页
   ·城市路网抗震可靠性影响因素分析第18-19页
     ·道路两侧建筑物的影响第18页
     ·路网拓扑结构的影响第18-19页
   ·路网单元可靠性第19-20页
     ·路段可靠性第19页
     ·桥梁可靠性第19-20页
   ·城市路网连通可靠度第20-23页
     ·单元路段可靠度第20-22页
     ·路段权重第22-23页
     ·路网连通可靠度第23页
   ·本章小结第23-24页
第三章 强化学习第24-32页
   ·强化学习理论基础第24-27页
     ·强化学习基本原理第24-26页
     ·强化学习系统的基本组成要素第26-27页
   ·马尔可夫决策过程第27-28页
     ·决策时刻与周期第27-28页
     ·状态与动作集第28页
     ·转移概率和报酬第28页
   ·强化学习中常用的几种算法第28-31页
     ·动态规划第28-29页
     ·蒙特卡罗算法第29页
     ·Q学习第29-30页
     ·Sarsa算法第30-31页
   ·局部搜索策略第31页
   ·本章小结第31-32页
第四章 基于Q学习的震后路径寻优模型第32-46页
   ·震后城市救援第32-33页
   ·模型假设第33页
   ·Q学习震后路径寻优模型第33-35页
     ·状态和动作的设定第34页
     ·环境的设定第34-35页
     ·即时报酬的选取第35页
   ·计算方法第35-36页
   ·实例分析第36-45页
     ·参数设定第40-41页
     ·结果分析第41-44页
     ·敏感性分析第44-45页
   ·本章小结第45-46页
第五章 多智能体震后救援路径选择模型第46-57页
   ·多智能体第46-47页
     ·多智能体协作目的第46-47页
     ·多智能体环境第47页
   ·多智能体震后救援路径选择模型第47-52页
     ·模型假设第47-48页
     ·多智能体间通信机制第48-50页
     ·多智能体寻优模型第50页
     ·计算方法第50-52页
   ·实例分析第52-56页
     ·参数设定第52-53页
     ·结果分析第53-56页
   ·本章小结第56-57页
第六章 结论与展望第57-59页
   ·结论第57页
   ·展望第57-59页
参考文献第59-62页
致谢第62-63页
个人简历、在学期间的研究成果及发表的学术论文第63页

论文共63页,点击 下载论文
上一篇:城市震后路网阻断预测模型
下一篇:基于OMAP的ADCP系统设计