首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于平均型强化学习算法的动态调度方法的研究

摘要第1-4页
ABSTRACT第4-8页
第一章 绪论第8-15页
   ·动态调度方法研究现状第8-13页
     ·基于运筹学的动态调度方法第8-9页
     ·基于人工智能的动态调度方法第9-12页
     ·基于强化学习的方法第12-13页
   ·论文研究的主要内容第13-14页
   ·论文结构安排第14-15页
第二章 强化学习方法的研究第15-29页
   ·强化学习的基本原理和发展第15-19页
     ·强化学习框架整体结构第15-16页
     ·强化学习系统中的基本元素第16-17页
     ·强化学习与其他学习方法的比较第17-18页
     ·强化学习理论的发展第18-19页
   ·强化学习的理论背景和有关算法第19-28页
     ·MDP 基础理论第19-20页
     ·折扣型 MDP 及其动态规划解法第20-22页
     ·折扣型 MDP 的强化学习方法第22-24页
     ·平均型 MDP 及其动态规划解法第24-25页
     ·平均型 MDP 的强化学习方法第25-26页
     ·应用强化学习算法的注意事项第26-28页
   ·小结第28-29页
第三章 强化学习算法环境 Grid-World 的建立及典型算法比较第29-47页
   ·强化学习算法分析环境 Grid-World 的建立第29-37页
     ·Grid-World 环境介绍第29-30页
     ·可视化 Grid-World 仿真环境的建立第30-37页
   ·典型算法及参数分析比较第37-46页
     ·强化学习算法流程第37-39页
     ·仿真结果分析第39-46页
   ·小结第46-47页
第四章 基于平均型强化学习算法的电梯动态调度第47-61页
   ·电梯群组调度第47-50页
     ·电梯群组调度系统基本概念第47-48页
     ·电梯群组调度方法第48-50页
   ·基于平均型强化学习算法的电梯群组调度第50-56页
     ·建立强化学习算法模型第50-52页
     ·强化学习调度算法第52-55页
     ·算法流程第55-56页
   ·算法仿真环境第56-57页
   ·仿真实验与结果分析第57-60页
     ·仿真参数设定第57-58页
     ·仿真结果与分析第58-60页
   ·小结第60-61页
第五章 总结与展望第61-63页
   ·论文的总结第61-62页
   ·进一步的工作第62-63页
参考文献第63-68页
发表论文和参加科研情况说明第68-69页
致 谢第69页

论文共69页,点击 下载论文
上一篇:大庆外围低渗透油田波动采油现场试验
下一篇:Isomap算法及其在脑电产生源分类中的应用