首页--交通运输论文--公路运输论文--交通工程与公路运输技术管理论文--电子计算机在公路运输和公路工程中的应用论文

基于Sarsa学习算法的路径诱导算法研究

摘要第7-8页
Abstract第8-9页
第1章 绪论第13-19页
    1.1 研究的背景和意义第13-14页
    1.2 国内外研究现状第14-17页
    1.3 研究的目标和内容第17-18页
    1.4 本文组织结构第18-19页
第2章 相关研究工作第19-27页
    2.1 引言第19页
    2.2 强化学习第19-24页
        2.2.1 基于强化学习的智能控制方法第20-21页
        2.2.2 强化学习的MDP模型第21页
        2.2.3 强化学习的最优策略第21-22页
        2.2.4 行为选择策略第22-23页
        2.2.5 TD算法第23页
        2.2.6 Sarsa学习算法第23-24页
    2.3 中心式路径诱导系统第24-25页
    2.4 本章小结第25-27页
第3章 基于Sarsa学习的路径诱导算法第27-35页
    3.1 引言第27页
    3.2 传统路径诱导算法第27-29页
        3.2.1 Dijkstra算法第28页
        3.2.2 A*算法第28-29页
    3.3 基于Sarsa学习路径诱导系统的强化学习模型第29-31页
        3.3.1 路径诱导算法的强化学习模型第29页
        3.3.2 Q值表第29-30页
        3.3.3 基于Q值的动态规划算法第30-31页
    3.4 基于Sarsa学习的路径诱导算法第31-34页
    3.5 本章小结第34-35页
第4章 基于全局和局部联合控制策略的动态路径诱导算法第35-44页
    4.1 引言第35-36页
    4.2 基于全局和局部联合控制策略的波兹曼概率分布第36-38页
        4.2.1 改进的波兹曼概率分布第36-37页
        4.2.2 全局控制策略第37页
        4.2.3 局部控制策略第37-38页
    4.3 基于全局和局部联合控制策略的动态路径诱导算法第38-40页
    4.4 全局和局部控制参数分析第40-43页
    4.5 本章小结第43-44页
第5章 基于多层网络的Sarsa学习路径诱导算法第44-56页
    5.1 引言第44-45页
    5.2 多层网第45-48页
    5.3 遗传算法聚类第48-49页
        5.3.1 遗传算法第48-49页
        5.3.2 基于遗传算法的聚类分析第49页
    5.4 基于遗传算法的多层网方法第49-51页
    5.5 基于多层网的路径诱导算法第51-55页
    5.6 本章小结第55-56页
第6章 仿真与实验结果分析第56-69页
    6.1 SUMO仿真器第56-58页
        6.1.1 SUMO仿真器介绍第56-57页
        6.1.2 SUMO仿真器界面第57-58页
    6.2 路径诱导算法算法仿真实验第58-68页
        6.2.1 仿真设置第58-59页
        6.2.2 基于Sarsa学习的路径诱导算法第59-64页
        6.2.3 基于全局和局部联合控制策略的动态路径诱导算法第64-67页
        6.2.4 基于多层网络的Sarsa学习路径诱导算法第67-68页
    6.3 本章小结第68-69页
结论第69-71页
参考文献第71-77页
攻读硕士学位期间发表的论文和获得的科研成果第77-78页
致谢第78-79页

论文共79页,点击 下载论文
上一篇:汽车左右后轮罩成形工艺研究
下一篇:基于深度学习的安全带检测方法研究