首页--交通运输论文--公路运输论文--交通工程与公路运输技术管理论文--交通工程与交通管理论文--线路交通安全设施论文

单交叉口配时优化的函数逼近型强化学习模型

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-20页
    1.1 研究背景第10-11页
    1.2 国内外研究现状第11-17页
        1.2.1 交通信号控制发展研究现状第11-14页
        1.2.2 单交叉口自适应控制研究现状第14-17页
    1.3 研究的目的及意义第17-18页
    1.4 论文研究技术路线第18-20页
第二章 强化学习原理与函数逼近方法第20-34页
    2.1 强化学习原理第20-27页
        2.1.1 强化学习模型第20-21页
        2.1.2 强化学习基本要素第21-23页
        2.1.3 马尔科夫决策过程第23-25页
        2.1.4 行为选择方法第25-27页
    2.2 强化学习算法第27-29页
        2.2.1 时间差分TD算法第27-28页
        2.2.2 Q学习算法第28-29页
    2.3 基于神经网络逼近的强化学习方法第29-34页
        2.3.1 神经网络逼近方法简介第29-30页
        2.3.2 基于神经网络逼近的强化学习算法第30-34页
第三章 基于状态离散的单交叉口配时优化在线Q学习模型第34-52页
    3.1 仿真平台构建第34-39页
        3.1.1 Vissim仿真路口构建与参数设置第35-36页
        3.1.2 Vissim-Excel VBA-Matlab数据通信第36-38页
        3.1.3 集成仿真平台的运行第38-39页
    3.2 基于状态离散的在线Q学习配时模型第39-52页
        3.2.1 在线Q学习配时模型的要素第39-44页
        3.2.2 在线Q学习仿真流程第44-47页
        3.2.3 在线Q学习仿真结果第47-52页
第四章 基于神经网络逼近的单交叉口配时优化在线Q学习模型第52-62页
    4.1 基于神经网络逼近的Q学习模型要素第52-53页
        4.1.1 状态、行为与奖赏第52页
        4.1.2 行为选择策略第52-53页
    4.2 基于神经网络逼近的Q学习算法第53-59页
        4.2.1 算法结构第53-54页
        4.2.2 算法流程第54-58页
        4.2.3 算法仿真结果第58-59页
    4.3 与状态离散的Q学习算法对比第59-62页
结论与展望第62-64页
参考文献第64-70页
致谢第70-72页
附录A 在线Q学习代码第72-84页
    A.1 Vissim仿真控制代码第72页
    A.2 在线Q学习VBA主程序代码第72-81页
    A.3 Q学习Matlab代码第81-84页
附录B 基于神经网络逼近的Q学习算法代码第84-94页
    B.1 基于神经网络逼近的Q学习算法VBA代码第84-91页
    B.2 基于神经网络逼近的Q学习算法Matlab代码第91-94页

论文共94页,点击 下载论文
上一篇:融资融券交易对我国股市波动性影响的实证研究
下一篇:物有所值评价在YX县PPP项目中的应用研究