基于MDP的多智能体交通信号灯控制的设计与研究
摘要 | 第4-5页 |
Abstract | 第5页 |
第1章 绪论 | 第8-14页 |
1.1 研究背景 | 第8-9页 |
1.2 国内外研究现状 | 第9-12页 |
1.2.1 智能交通系统国内外发展现状 | 第9-10页 |
1.2.2 交通信号控制系统国内外研究现状 | 第10-12页 |
1.3 研究方法 | 第12页 |
1.3.1 文献研究法 | 第12页 |
1.3.2 理论研究法 | 第12页 |
1.3.3 定量与定性分析相结合 | 第12页 |
1.4 研究路径 | 第12-13页 |
1.5 本人所做的主要工作 | 第13-14页 |
第2章 相关技术介绍 | 第14-21页 |
2.1 MDP介绍 | 第14-17页 |
2.1.1 MDP的由来 | 第14页 |
2.1.2 MDP的最优准则 | 第14-15页 |
2.1.3 MDP决策问题 | 第15-16页 |
2.1.4 MDP动态规划 | 第16-17页 |
2.2 智能体交通 | 第17-21页 |
2.2.1 智能体概念 | 第17-19页 |
2.2.2 多智能体系统 | 第19页 |
2.2.3 强化学习 | 第19-21页 |
第3章 城市主干道路口信号灯配时问题描述 | 第21-32页 |
3.1 交通控制形式 | 第21-23页 |
3.1.1 集中式控制 | 第21页 |
3.1.2 分布式控制 | 第21-22页 |
3.1.3 两种形式对比 | 第22-23页 |
3.2 MDP博弈架构 | 第23-26页 |
3.2.1 多参与者零和决策架构 | 第23-25页 |
3.2.2 纳什均衡划分 | 第25-26页 |
3.3 MDP交叉协作控制 | 第26-32页 |
3.3.1 交叉协作模型 | 第26-28页 |
3.3.2 信号灯决策过程 | 第28-30页 |
3.3.3 强化学习算法 | 第30-32页 |
第4章 城市主干道路口车道流量模型 | 第32-40页 |
4.1 城市主干道路口组间分析 | 第32-34页 |
4.2 城市主干道路口车道流量分析 | 第34-36页 |
4.3 城市主干道路口车道流量优化 | 第36-40页 |
第5章 多智能体交通信号灯控制设计与实现 | 第40-55页 |
5.1 多智能体交通信号灯控制设计 | 第40-44页 |
5.1.1 基本模型的建立 | 第40-42页 |
5.1.2 信任状态优化求解 | 第42-44页 |
5.2 多智能体交通信号灯控制实现 | 第44-47页 |
5.2.1 信号灯控制器决策 | 第44-46页 |
5.2.2 信号灯控制的学习 | 第46-47页 |
5.3 仿真与结果 | 第47-55页 |
第6章 结论与展望 | 第55-57页 |
6.1 结论 | 第55页 |
6.2 展望 | 第55-57页 |
参考文献 | 第57-60页 |
致谢 | 第60页 |