首页--交通运输论文--公路运输论文--交通工程与公路运输技术管理论文--交通工程与交通管理论文--线路交通安全设施论文

基于强化学习的城市交通信号控制方法研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-13页
   ·研究背景第7-8页
   ·研究现状第8-10页
     ·国外研究现状第8-9页
     ·国内研究现状第9-10页
   ·本文的主要工作和组织结构第10-13页
     ·主要工作第10-11页
     ·组织结构第11-13页
第二章 强化学习在交通信号控制中的应用第13-23页
   ·强化学习与马尔可夫决策第13-14页
   ·强化学习要素与基本模型第14-15页
   ·强化学习主要算法与探索策略第15-18页
     ·瞬时差分算法第16-17页
     ·Q 学习算法第17页
     ·Sarsa 学习算法第17-18页
     ·强化学习常用探索策略第18页
   ·基于模型的 Q 学习算法第18-19页
   ·强化学习用于交通信号控制第19-21页
     ·交通建模第19-20页
     ·交通信号控制的状态描述第20页
     ·基于模型的强化学习用于交通信号控制第20-21页
   ·本章小结第21-23页
第三章 建立于全局拥堵因子的改进控制方法第23-35页
   ·交通信号控制问题描述及建模第23-25页
     ·基于车辆的状态描述方法的优点第23-24页
     ·基于车辆的状态描述方法建模第24-25页
   ·多 Agent 系统之间的通信机制第25-27页
     ·无通信模式第25-26页
     ·消息传递模式第26页
     ·方案传递模式第26页
     ·黑板模式第26-27页
   ·基于全局拥堵因子改进的交通信号控制方法第27-30页
     ·TC-GAGC 方法建模第27-28页
     ·全局拥堵因子的引入及改进的动作策略第28-30页
   ·仿真实验与结果分析第30-34页
   ·本章小结第34-35页
第四章 基于启发式强化学习的交通信号控制方法第35-47页
   ·启发式强化学习第35-38页
     ·启发式加速强化学习第35-36页
     ·定义启发函数第36-37页
     ·启发式加速 Q 学习第37-38页
   ·HAQL 用于交通信号控制第38-40页
     ·TC-HAQL 方法的建模问题第38页
     ·启发函数的确定第38-39页
     ·TC-HAQL 方法的学习过程第39-40页
   ·仿真实验与结果分析第40-45页
   ·本章小结第45-47页
第五章 多 Agent 协作的交通信号控制方法第47-65页
   ·多 Agent 系统中的强化学习第47-48页
     ·合作与协调第47-48页
     ·知识学习第48页
   ·协作图第48-49页
   ·利用信号灯-交叉口联合动作改进的协作图交通建模第49-50页
   ·TCLJ 交通信号控制方法第50-56页
     ·TCLJ 方法的引入第50-51页
     ·仿真实验与结果分析第51-56页
   ·MaxplusLJ 交通信号控制方法第56-63页
     ·Max-plus 算法介绍第56-57页
     ·MaxplusLJ 交通信号控制方法设计与实现第57-58页
     ·仿真实验与结果分析第58-63页
   ·本章小结第63-65页
第六章 结束语第65-67页
   ·本文总结第65页
   ·问题与展望第65-67页
致谢第67-69页
参考文献第69-73页
攻读硕士期间研究成果第73-74页

论文共74页,点击 下载论文
上一篇:车辆路径规划的连续多目标优化模型设计及其求解方法
下一篇:基于智能交通系统的城市路网短时交通预测