摘要 | 第1-4页 |
Abstract | 第4-7页 |
第1章 前言 | 第7-11页 |
·研究意义 | 第7页 |
·研究现状 | 第7-9页 |
·研究内容 | 第9-10页 |
·论文结构 | 第10-11页 |
第2章 博弈论和强化学习 | 第11-20页 |
·博弈论简介 | 第11-13页 |
·博弈概念 | 第11-12页 |
·博弈均衡 | 第12-13页 |
·强化学习简介 | 第13-20页 |
·强化学习概念 | 第14-18页 |
·强化学习研究进展与应用 | 第18-20页 |
第3章 基于博弈论和强化学习的交通最优调度策略学习方法 | 第20-35页 |
·多AGENT 交通博弈问题描述及模型建立 | 第20-22页 |
·多AGENT 交通博弈模型下协调约束的最优调度策略学习 | 第22-28页 |
·收益值和惩罚值的计算 | 第23-25页 |
·回报值的计算 | 第25-27页 |
·多AGENT 博弈交通模型的NASH-Q 学习算法 | 第27-28页 |
·实例分析 | 第28-31页 |
·实验结果 | 第31-33页 |
·小结 | 第33-35页 |
第4章 基于博弈论和强化学习的交通路口调度系统 | 第35-47页 |
·多AGENT 交通调度系统的设计 | 第35-37页 |
·多AGENT 交通调度系统的实现 | 第37-46页 |
·基于博弈论和强化学习的交通路口调度系统 | 第38-42页 |
·基于博弈论和强化学习的交通路口改造预测系统 | 第42-46页 |
·小结 | 第46-47页 |
第5章 总结与展望 | 第47-48页 |
参考文献 | 第48-51页 |
致谢 | 第51-52页 |
附录 | 第52-59页 |
A1. 攻读硕士学位期间发表的论文 | 第52页 |
A2. 攻读硕士学位期间获准的软件著作权登记 | 第52页 |
A3. 交通路口调度系统软件主要代码 | 第52-59页 |