首页--交通运输论文--公路运输论文--交通工程与公路运输技术管理论文--交通工程与交通管理论文--线路交通安全设施论文

Q学习在单路口交通信号控制中的应用研究

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-17页
   ·选题背景第10-11页
   ·强化学习的研究现状第11-14页
     ·强化学习的理论研究现状第11-13页
     ·强化学习在交通信号控制中的应用第13-14页
   ·Q 学习算法的特点及存在的问题第14-15页
   ·研究的目的与意义第15页
   ·论文的主要研究内容第15-17页
第二章 强化学习的理论基础第17-27页
   ·智能体理论第17页
     ·Agent 的概念第17页
     ·Agent 的特征第17页
   ·强化学习的基本原理第17-19页
   ·Q 学习算法的基本理论第19-23页
     ·Markov 决策过程模型第19页
     ·期望回报函数第19-20页
     ·状态-动作对的Q 值函数第20-21页
     ·动作选择机制第21-23页
     ·Q 值函数的更新第23页
   ·强化学习的其他主要算法第23-26页
     ·蒙特卡罗算法第23-24页
     ·瞬时差分学习算法第24-25页
     ·SARSA 学习算法第25页
     ·R 学习算法第25-26页
     ·Dyna 学习算法第26页
   ·本章小结第26-27页
第三章 基于 Q 学习的单路口信号控制方法研究第27-38页
   ·交叉口交通信号控制的相关概念第27-30页
   ·Q 学习算法进行单路口信号控制关键问题分析第30-33页
     ·单路口状态空间的选择第30-32页
     ·状态转化后所取得的奖励函数的确定第32页
     ·在状态确定后后续动作的确定第32页
     ·如何确定最佳Q 值是否已经获得第32-33页
     ·学习参数的选择第33页
   ·基于Q 学习的单路口交通信号控制体系第33-35页
   ·Q 学习交通信号控制算法第35-37页
     ·信号控制动作集第35-36页
     ·算法步骤第36-37页
     ·算法设计第37页
   ·本章小结第37-38页
第四章 算例分析第38-54页
   ·算例介绍第38-39页
   ·定时信号配时第39-40页
   ·基于固定周期的Q 学习信号优化配时第40-47页
     ·第1 时间段第41-44页
     ·第2 时间段第44-45页
     ·第3 时间段第45页
     ·第4 时间段第45-46页
     ·第5 时间段第46-47页
   ·基于可变周期的Q 学习信号优化配时第47-51页
     ·第1 时间段第47-48页
     ·第2 时间段第48-49页
     ·第3 时间段第49-50页
     ·第4 时间段第50-51页
     ·第5 时间段第51页
   ·Q 学习控制法与WEBSTER 法延误对比第51-53页
   ·本章小结第53-54页
第五章 结论与展望第54-55页
   ·本论文主要结论第54页
   ·有待进一步研究的问题第54-55页
参考文献第55-58页
致谢第58-59页
附录A(攻读学位期间发表学术论文与科研项目)第59-60页
附录B 单路口 Q 学习交通信号控制算法 MATLAB 程序第60-66页
 B.1 Q 学习主函数 MATLAB 程序语言第60-64页
 B.2 固定周期 Q 学习测试脚本第64-65页
 B.3 可变周期 Q 学习测试脚本第65-66页

论文共66页,点击 下载论文
上一篇:区域农村公路网布局规划方法研究
下一篇:轨道交通与常规公交合作竞争模式研究