基于强化学习的电梯群控调度技术研究

摘要	第1-6页
Abstract	第6-10页
第1章绪论	第10-16页
·课题来源和意义	第10-11页
·国内外研究现状	第11-14页
·电梯群控系统的研究现状	第11-13页
·群控系统主要难点	第13页
·强化学习算法的研究现状	第13-14页
·课题的来源及研究内容	第14-16页
·课题来源	第14页
·课题的主要研究内容	第14-16页
第2章电梯群控调度问题研究	第16-22页
·群控系统性能评价方法	第16-17页
·电梯群控动态调度研究方法	第17-20页
·传统的调度方法	第17-18页
·智能调度方法	第18-20页
·基于强化学习的方法	第20-21页
·本章小结	第21-22页
第3章强化学习方法的研究	第22-30页
·强化学习的基本思想	第22-23页
·强化学习的基本概念	第22页
·强化学习的原理	第22-23页
·强化学习的基本模型	第23-26页
·强化学习的理论背景	第23-25页
·建立数学模型	第25-26页
·强化学习中的典型算法	第26-28页
·动态规划	第26-28页
·Q-learning 算法	第28页
·其他算法	第28页
·本章小结	第28-30页
第4章基于强化学习的电梯群控调度技术研究与设计	第30-38页
·电梯群控的调度问题	第30-33页
·电梯群控的调度目标	第30页
·电梯交通的模式	第30-31页
·电梯群组调度的问题模型	第31-33页
·基于强化学习的电梯群控调度	第33-35页
·值调度算法	第33-34页
·行为选择的探索性随机策略	第34页
·基于神经网络的泛化技术	第34-35页
·电梯群控系统的调度算法	第35-36页
·本章小结	第36-38页
第5章实验平台与调度结果分析	第38-45页
·电梯群组调度的仿真环境	第38-39页
·基于强化学习的电梯调度算法的运行环境	第39-41页
·电梯动态调度仿真实验与结果分析	第41-44页
·本章小结	第44-45页
结论	第45-46页
参考文献	第46-49页
攻读硕士学位期间所发表的学术论文	第49-50页
致谢	第50页