首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

CSPS模型基于学习的Look-ahead控制研究

摘要第1-6页
ABSTRACT第6-13页
第一章 绪论第13-21页
   ·基于传送带服务的生产加工站(CSPS)第13页
   ·强化学习第13-16页
     ·强化学习定义第14页
     ·强化学习的主要元素和特点第14-15页
     ·强化学习算法第15-16页
   ·MDP/SMDP以及性能势理论第16-19页
     ·MDP/SMDP的概述第16-18页
     ·MDP/SMDP和性能势的关系第18-19页
   ·论文的组织结构第19-21页
第二章 CSPS问题第21-27页
   ·CSPS模型的概述第21-22页
   ·CSPS模型的控制模式说明第22-25页
   ·CSPS模型的优化目标第25-27页
第三章 CSPS的半Markov决策过程模型第27-39页
   ·半Markov决策过程的分类和数学模型第27-29页
     ·半Markov决策0的分类第27页
     ·半Markov决策过程的数学模型第27-29页
   ·CSPS建模为半Markov决策过程模型第29-33页
     ·基本的符号和概念第29-30页
     ·系统和性能函数第30-33页
   ·半Markov决策过程的优化第33-36页
     ·SMDP的优化目标第33-34页
     ·SMDP的优化方法第34页
     ·SMDP的Bellman最优性方程第34-36页
   ·SMDP与其等价MDP及α-一致化链第36-39页
第四章 CSPS基于策略迭代和Q学习的look-ahead控制第39-52页
   ·策略迭代概述第39-40页
   ·CSPS模型基于性能势的策略迭代的优化第40-42页
     ·基于性能势的策略迭代算法第40-41页
     ·策略迭代与CSPS问题第41-42页
   ·性能势与Q学习第42-44页
     ·Q学习的原理第42页
     ·基于性能势的Q学习第42-44页
   ·CSPS模型基于性能势的Q学习优化第44-45页
     ·Q函数的最优性方程第44-45页
     ·基于性能势的Q学习优化算法第45页
   ·实验结果第45-52页
第五章 CSPS基于Rollout的look-ahead控制第52-60页
   ·基于性能势的Rollout算法第52-53页
   ·CSPS模型基于性能势的Rollout优化第53-56页
     ·基于性能势的Rollout优化算法第53-54页
     ·摄动分析方法在Rollout优化算法的使用第54页
     ·基于历史信息和摄动技术的Rollout算法第54-56页
   ·实验结果第56-60页
第六章 总结第60-61页
参考文献第61-65页
硕士学位期间主要科研工作和成果第65页

论文共65页,点击 下载论文
上一篇:石家庄宝石电子集团有限责任公司战略变革探讨
下一篇:医用高值耗材价格虚高的分析与对策