首页--交通运输论文--公路运输论文--道路工程论文--道路养护与维修论文

应急管理中道路抢修队调度问题的建模和求解

致谢第7-8页
摘要第8-9页
ABSTRACT第9页
第一章 绪论第14-21页
    1.1 课题背景、目的与意义第14-16页
        1.1.1研究背景第14-16页
        1.1.2 论文研究的目的和意义第16页
    1.2 国内外研究现状第16-19页
        1.2.1 应急路径修复相关研究第16-18页
        1.2.2 强化学习方法用于决策规划问题的相关研究第18-19页
    1.3 本文研究内容与论文组织第19-21页
第二章 相关理论介绍第21-32页
    2.1 受损路网修复的基本原则第21页
    2.2 路网修复工作的约束条件第21-22页
    2.3 环境中的Agent第22-24页
    2.4 有限马尔科夫决策过程第24-26页
    2.5 强化学习中的一般模型第26-29页
        2.5.1 目标与回报第26-27页
        2.5.2 策略和值函数第27-28页
        2.5.3 最优策略与最优值函数第28-29页
    2.6 Q-learning算法第29-31页
    2.7 本章小节第31-32页
第三章 无连续受损路段下的抢修队调度问题的建模与求解第32-47页
    3.1 引言第32页
    3.2 问题描述第32-34页
    3.3 马尔科夫决策模型第34-37页
        3.3.1 Agent的动作第34页
        3.3.2 Agent的状态第34-35页
        3.3.3 Agent的回报模型第35-36页
        3.3.4 Agent的马尔科夫决策模型第36-37页
    3.4 基于Q-learning的调度策略求解第37-39页
    3.5 实验结果与分析第39-46页
        3.5.1 实验环境与参数设置第39-40页
        3.5.2 算法运行时间第40-41页
        3.5.3 路网修复效果第41-43页
        3.5.4 抢修队的规划方案第43-46页
    3.6 本章小节第46-47页
第四章 连续受损路段下的抢修队调度问题的建模与求解第47-65页
    4.1 引言第47页
    4.2 问题描述第47-49页
    4.3 修复连续受损路段的决策模型第49-54页
        4.3.1 Agent的动作第49页
        4.3.2 Agent的状态第49-50页
        4.3.3 Agent的回报模型第50-51页
        4.3.4 修复连续受损路段的马尔科夫决策过程第51-54页
    4.4 基于Q-learning的连续受损路段中抢修队调度算法第54-57页
        4.4.1 Q-learning算法第54页
        4.4.2 α的设置第54-56页
        4.4.3 平衡Agent的探索和利用第56-57页
    4.5 实验结果与分析第57-64页
        4.5.1 路网环境的参数设置第57-60页
        4.5.2 路网修复效果第60-61页
        4.5.3 抢修队的规划方案第61-64页
    4.6 本章小节第64-65页
第五章 总结与展望第65-67页
    5.1 本文的主要创新点第65页
    5.2 进一步的研究工作第65-67页
        5.2.1 受损路网的修复层面第65-66页
        5.2.2 求解算法层面第66-67页
参考文献第67-71页
攻读硕士学位期间的学术活动及成果情况第71-72页

论文共72页,点击 下载论文
上一篇:铝合金薄板结构MIG焊焊接缺陷的产生机理及控制措施
下一篇:LNG加注船风险识别及加注作业风险分析