首页--工业技术论文--建筑科学论文--房屋建筑设备论文--机电设备论文--电梯工程论文

基于强化学习的电梯群控调度技术研究

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第12-26页
    1.1 课题研究的背景第12-13页
    1.2 电梯群控调度系统的历史和现状研究第13-23页
        1.2.1 电梯群控的发展历史第13-18页
        1.2.2 电梯群控的现状研究第18-23页
    1.3 课题的来源及研究意义第23-24页
    1.4 本课题的工作内容第24-26页
第二章 电梯群组调度方法比较第26-39页
    2.1 电梯群控的结构第26-28页
    2.2 电梯运行中的交通流模式第28-32页
    2.3 传统调度与智能调度方法第32-36页
        2.3.1 传统调度方法第32-34页
        2.3.2 智能调度方法第34-36页
    2.4 基于强化学习的调度方法第36-38页
    2.5 本章小结第38-39页
第三章 强化学习的一些基本研究方法第39-52页
    3.1 强化学习的由来第39-41页
        3.1.1 机器学习第39-40页
        3.1.2 监督学习、半监督学习和强化学习第40页
        3.1.3 强化学习的现状与发展第40-41页
    3.2 强化学习的原理和模型第41-45页
        3.2.1 强化学习模型第41-42页
        3.2.2 马尔科夫决策过程(Markov Decision Process)第42-43页
        3.2.3 值函数和最优值函数第43-45页
    3.3 强化学习的几种算法第45-47页
        3.3.1 差分瞬时学习方法(Temporal Difference Methods )第45-46页
        3.3.2 Q-学习算法第46-47页
        3.3.3 sarsa算法第47页
    3.4 基于模型的强化学习算法第47-49页
        3.4.1 无模型的强化学习算法第48页
        3.4.2 基于模型的强化学习算法第48-49页
    3.5 强化学习的主要应用第49-50页
        3.5.1 智能机器人第49页
        3.5.2 游戏娱乐方面第49-50页
        3.5.3 在管理调度中的应用第50页
        3.5.4 控制系统中的应用第50页
    3.6 本章小结第50-52页
第四章 强化学习方法下的电梯调度研究第52-70页
    4.1 研究目标第52页
    4.2 电梯群组调度问题第52-57页
        4.2.1 电梯群组调度系统第52-55页
        4.2.2 调度目标第55-56页
        4.2.3 交通模式第56-57页
    4.3 电梯群组调度的问题模型第57-60页
    4.4 基于强化学习的电梯群控调度算法第60-67页
        4.4.1 值迭代算法第60-62页
        4.4.2 模拟退火的随机搜索策略第62-65页
        4.4.3 基于CMAC神经网络的局部最优逼近第65-67页
    4.5 电梯群控调度算法第67-68页
    4.6 本章小结第68-70页
第五章 电梯群组调度的算法实现与仿真实验第70-86页
    5.1 仿真环境第70-72页
        5.1.1 虚拟仿真群组调度环境第70-72页
        5.1.2 调度算法的运行环境第72页
    5.2 软件的设计与实现第72-79页
        5.2.1 算法的结构第72-73页
        5.2.2 算法的过程第73-79页
    5.3 软件实验与结果分析第79-84页
        5.3.1 软件仿真的条件第79页
        5.3.2 设定强化学习算法参数第79-80页
        5.3.3 仿真运行与分析第80-84页
    5.4 小结第84-86页
结论第86-88页
参考文献第88-94页
攻读学位期间本人出版或公开发表的论著、论文第94-95页
致谢第95-96页

论文共96页,点击 下载论文
上一篇:C房地产项目成本管理研究
下一篇:星级酒店室内设计中FF&E设计的本土化研究