首页--交通运输论文--公路运输论文--交通工程与公路运输技术管理论文--交通工程与交通管理论文--线路交通安全设施论文

面向排队长度管理的单交叉口在线Q学习控制模型

【摘要】:为了优化交叉口信号配时,本文通过建立Excel Vba-Vissim-Matlab集成仿真平台,建立了以总关键排队长度之差最小为优化目标的单交叉口在线Q学习模型。在线模型分为定周期Q学习配时模型、不定周期Q学习配时模型。针对控制性能指标相对于临近的配时方案不敏感的特点,提出了以平均总关键排队长度之差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性。定周期两相位Q学习模型算例表明Q学习模型的正确性,能够随着流量变化动态优化,而且利用经验可以缩短学习时间。通过对猴子石大桥交通状况的模拟测试,表明模型具有很好的实际应用能力。通过定周期Q学习配时方案、不定周期Q学习配时方案与Transyt配时方案的对比,结果表明以总关键排队长度之差作为优化目标能够优化整个交叉口的时空资源,本论文建立的在线Q学习模型具有较高的准确性、鲁棒性和学习能力,通过学习能够实现优化目标。同时还探讨了流量变化情况下定周期、不定周期Q学习配时模型的性能。
【关键词】:交通工程 信号控制交叉口 定周期Q学习配时 不定周期Q学习配时
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:U491.54
论文共112页,点击 下载论文
上一篇:佛山一环同步薄层罩面预防性养护技术研究
下一篇:新型聚合物处理软岩边坡综合应用技术研究