基于强化学习算法的电梯动态调度策略的研究

第一章绪论	第1-13页
·问题背景	第7-9页
·离散事件动态系统与电梯群组系统	第7-8页
·调度问题	第8-9页
·国内外现状	第9-11页
·DEDS 的动态调度研究现状	第9页
·电梯群组调度研究现状	第9-11页
·课题提出与研究内容	第11-13页
·目前存在的问题	第11-12页
·课题任务与研究内容	第12-13页
第二章 DEDS 动态调度方法研究	第13-20页
·传统方法	第13-14页
·基于运筹学的方法	第13-14页
·基于启发式规则的方法	第14页
·基于仿真的方法	第14页
·智能方法	第14-18页
·基于知识的方法	第14-16页
·基于智能搜索的方法	第16页
·基于多智能体的方法	第16-18页
·基于强化学习的方法	第18-19页
·小结	第19-20页
第三章强化学习方法研究	第20-38页
·基本原理	第20-24页
·基本概念	第20-21页
·基本原理和历史发展	第21-24页
·理论背景与基本模型	第24-30页
·理论背景	第24-26页
·动态规划与强化学习	第26-29页
·强化学习模型	第29-30页
·方法分类与典型算法	第30-37页
·方法分类	第30-33页
·典型算法	第33-37页
·小结	第37-38页
第四章基于强化学习的电梯动态调度	第38-55页
·研究步骤	第38-39页
·电梯群组调度问题	第39-43页
·电梯群组调度系统	第39-41页
·调度目标	第41页
·交通模式	第41-42页
·调度问题难点	第42-43页
·问题模型	第43-47页
·相关假设	第43-44页
·问题模型	第44-47页
·基于强化学习的调度算法	第47-53页
·值迭代算法	第47-49页
·探索性随机策略	第49页
·泛化方法	第49-52页
·调度算法	第52-53页
·小结	第53-55页
第五章算法实现与仿真实验	第55-67页
·仿真环境	第55-57页
·虚拟仿真环境	第55-56页
·调度算法运行环境	第56-57页
·软件设计与实现	第57-60页
·算法结构	第57-59页
·程序流程	第59-60页
·仿真实验与结果分析	第60-66页
·仿真环境设定	第61页
·仿真运行与分析	第61-66页
·小结	第66-67页
结束语	第67-69页
参考文献	第69-77页
发表论文和参加科研情况说明	第77-78页
致谢	第78页