首页--交通运输论文--公路运输论文--交通工程与公路运输技术管理论文--交通工程与交通管理论文--线路交通安全设施论文

基于TD方法的单交叉口信号配时优化研究

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-17页
   ·选题背景第9页
   ·国内外研究现状第9-15页
     ·SCATS 自适应系统第11-13页
     ·SCOOT 自适应系统第13页
     ·OPAC 自适应系统第13-14页
     ·RHODES 自适应控制系统第14-15页
   ·研究目的与意义第15页
   ·论文的主要研究内容第15-17页
第二章 强化学习理论第17-27页
   ·强化学习的研究现状第17-19页
   ·强化学习的基本原理第19-20页
   ·TD 学习第20-26页
     ·Sarsa 算法:在线的 TD 控制第21-23页
     ·Q 学习算法:离线的 TD 控制第23页
     ·Actor-Critic 方法第23-24页
     ·R 学习算法第24-26页
   ·TD 方法的优缺点第26-27页
第三章 绿灯时间等饱和度的状态离散 TD 学习模型第27-43页
   ·基本概念第27-28页
   ·建模方法第28-30页
     ·算法的模式选择第28-29页
     ·模型建立的关键因素第29-30页
   ·状态离散和行为的选取第30页
   ·优化模型第30-35页
     ·定周期奖赏不分级的 TD 学习优化模型第30-31页
     ·定周期奖赏分级的 TD 学习优化模型第31-32页
     ·变周期奖赏不分级的 TD 学习优化模型第32-33页
     ·变周期奖赏分级的 TD 学习优化模型第33-35页
   ·算例分析第35-42页
     ·计算环境第35-36页
     ·定周期奖赏不分级的 TD 学习优化模型第36-38页
     ·定周期奖赏分级的 TD 学习优化模型第38-39页
     ·变周期奖赏不分级的 TD 学习优化模型第39-40页
     ·变周期奖赏分级的 TD 学习优化模型第40-42页
   ·本章小结第42-43页
第四章 绿灯时间等饱和度的状态模糊 TD 学习模型第43-57页
   ·状态模糊方法第43-45页
     ·模糊理论简介第43-44页
     ·隶属度函数第44-45页
   ·状态模糊函数的选取第45-46页
   ·定周期奖赏不分级的状态模糊 TD 学习优化模型第46-48页
     ·优化模型第46-47页
     ·算例分析第47-48页
   ·定周期奖赏分级的状态模糊 TD 学习优化模型第48-51页
     ·优化模型第48-49页
     ·算例分析第49-51页
   ·变周期奖赏不分级的状态模糊 TD 学习优化模型第51-53页
     ·优化模型第51页
     ·算例分析第51-53页
   ·变周期奖赏分级的状态模糊 TD 学习优化模型第53-56页
     ·优化模型第53-54页
     ·算例分析第54-56页
   ·本章小结第56-57页
第五章 结论与展望第57-59页
   ·结论第57页
   ·展望第57-59页
参考文献第59-62页
致谢第62-63页
附录 A(攻读学位期间发表学术论文与科研项目)第63-64页
附录 B 单路口 Q 学习交通信号控制算法 MATLAB 程序第64-73页
 B.1 定周期奖赏不分级的主程序:第64-66页
 B.2 定周期奖赏分级的主程序:第66-68页
 B.3 变周期奖赏不分级的主程序:第68-70页
 B.4 变周期奖赏分级的主程序:第70-72页
 B.5 状态模糊主程序:第72-73页

论文共73页,点击 下载论文
上一篇:慢行交通稳静化设计适应性研究
下一篇:孔道压浆材料试验及技术研究