首页--交通运输论文--公路运输论文--交通工程与公路运输技术管理论文--交通工程与交通管理论文--线路交通安全设施论文

强化学习及其在城市交通信号控制中的应用研究

摘要第1-4页
ABSTRACT第4-7页
第一章 绪论第7-13页
   ·研究背景和意义第7-8页
   ·国内外研究状况第8-10页
     ·国外研究状况第8-9页
     ·国内研究状况第9-10页
   ·论文的主要研究内容第10-11页
   ·论文的组织结构第11-13页
第二章 强化学习理论第13-25页
   ·强化学习发展历史、研究现状及应用第13-14页
     ·强化学习发展历史第13页
     ·强化学习研究现状和应用第13-14页
   ·强化学习基本原理和模型第14-16页
     ·强化学习的基本原理第14-15页
     ·Agent 和强化学习的模型第15-16页
   ·基于模型的强化学习第16-20页
     ·马尔可夫决策过程第16-18页
     ·基于模型的强化学习方法第18-20页
   ·模型无关的强化学习第20-22页
     ·瞬时差分算法第20页
     ·Q 学习算法第20-21页
     ·Sarsa 算法第21-22页
   ·多 Agent 系统中的分布式强化学习第22-23页
   ·强化学习及其应用中存在的问题第23-24页
   ·本章小结第24-25页
第三章 基于 MBRL 的交通信号控制方法第25-39页
   ·交通建模及交通信号控制术语第25-27页
   ·改进的 TC1 方法—TCSG 交通信号控制方法第27-37页
     ·基于车辆状态描述方法的交通信号控制问题建模第27-29页
     ·TCSG 交通信号控制方法第29-33页
     ·仿真实验及分析第33-37页
   ·本章小结第37-39页
第四章 基于 Q 学习理论的交通信号控制方法第39-61页
   ·DMFQ 交通信号控制方法第39-48页
     ·DMFQ 交通信号控制方法介绍第39-42页
     ·DMFQ 方法的多 Agent 共享 Q 值协作及学习过程第42-43页
     ·仿真实验及分析第43-48页
   ·QSGWE 交通信号控制方法第48-53页
     ·QSGWE 交通信号控制方法介绍第48-50页
     ·QSGWE 方法的学习过程及多 Agent 的共享协作第50页
     ·仿真实验及分析第50-53页
   ·DMFQV 交通信号控制方法第53-60页
     ·DMFQV 交通信号控制方法介绍第54-55页
     ·DMFQV 方法的学习过程及多 Agent 共享 V 值的协作第55-56页
     ·仿真实验及分析第56-60页
   ·本章小结第60-61页
第五章 基于 Sarsa 学习理论的交通信号控制方法第61-73页
   ·DMFS 交通信号控制方法第61-66页
     ·DMFS 交通信号控制方法介绍第61-62页
     ·DMFS 方法的学习过程及多 Agent 共享 Q 值的协作第62页
     ·仿真实验及分析第62-66页
   ·SSGWE 交通信号控制方法第66-71页
     ·SSGWE 交通信号控制方法介绍第66-67页
     ·SSGWE 方法的学习过程及多 Agent 的共享协作第67-68页
     ·仿真实验及分析第68-71页
   ·本章小结第71-73页
第六章 总结与展望第73-77页
   ·总结第73-74页
   ·展望第74-77页
致谢第77-79页
参考文献第79-85页

论文共85页,点击 下载论文
上一篇:基于时间序列预测技术的隧道数据研究
下一篇:电厂控制系统的优化软件设计与实现