列车司机Agent的自学习机制及行为安全评估方法研究
| 中文摘要 | 第1-7页 |
| ABSTRACT | 第7-11页 |
| 1 绪论 | 第11-16页 |
| ·研究背景及意义 | 第11-12页 |
| ·国内外研究现状 | 第12-14页 |
| ·本文的主要框架 | 第14-16页 |
| 2 预备知识 | 第16-26页 |
| ·城市轨道交通平行控制与管理系统 | 第16-20页 |
| ·理论概述 | 第16-18页 |
| ·实例 | 第18-20页 |
| ·Agent的建模方法 | 第20-22页 |
| ·Agent的学习算法 | 第22-25页 |
| ·本章小结 | 第25-26页 |
| 3 基于Agent的列车司机建模及自学习机制建立 | 第26-33页 |
| ·基于Agent的列车司机建模 | 第26-28页 |
| ·列车司机Agent的学习知识描述 | 第28-30页 |
| ·学习知识的内容 | 第28-29页 |
| ·列车司机Agent的知识-行为关系 | 第29-30页 |
| ·列车司机Agent的自学习机制建立 | 第30-32页 |
| ·自学习机制的结构 | 第30-31页 |
| ·动态学习流程 | 第31-32页 |
| ·本章小结 | 第32-33页 |
| 4 列车司机Agent自学习机制中的算法实现 | 第33-49页 |
| ·Q学习算法的设计 | 第33-36页 |
| ·两级Q学习算法的融合 | 第36-38页 |
| ·两级Q学习算法融合的原理 | 第36-37页 |
| ·学习结果的融合 | 第37-38页 |
| ·加入先验知识的Q学习改进 | 第38-43页 |
| ·模糊综合决策 | 第38-39页 |
| ·先验知识获取 | 第39-43页 |
| ·基于先验知识的模糊-Q学习改进 | 第43-48页 |
| ·模糊-Q学习系统的结构 | 第43-44页 |
| ·仿真及结果分析 | 第44-48页 |
| ·本章小结 | 第48-49页 |
| 5 列车司机Agent的行为安全评估方法研究 | 第49-58页 |
| ·评估指标的确定 | 第49-51页 |
| ·评估指标的选取原则 | 第49页 |
| ·评估体系中指标的确定 | 第49-51页 |
| ·基于系统动力学的评估模型 | 第51-57页 |
| ·系统动力学原理及建模步骤 | 第51-54页 |
| ·评估模型的结构及方程 | 第54-56页 |
| ·仿真结果与分析 | 第56-57页 |
| ·本章小结 | 第57-58页 |
| 6 总结与展望 | 第58-60页 |
| 参考文献 | 第60-63页 |
| 作者简历 | 第63-65页 |
| 学位论文数据集 | 第65页 |