首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于模型的动态分层强化学习算法研究

摘要第1-4页
ABSTRACT第4-8页
第一章 绪论第8-16页
   ·研究背景及意义第8-9页
   ·国内外研究现状第9-14页
     ·强化学习的常用方法第10页
     ·大规模学习的"维数灾难"问题第10-11页
     ·自动分层方法第11-14页
   ·本文研究内容第14页
   ·论文构成第14-16页
第二章 未知环境中的动态分层问题第16-24页
   ·强化学习第16-19页
   ·分层强化学习第19-22页
     ·分层与抽象第20页
     ·MAXQ分层强化学习第20-22页
   ·动态分层的必要性和可行性分析第22-23页
   ·本章小结第23-24页
第三章 基于状态抽象的自动分层第24-36页
   ·基于贝叶斯学习的强化学习第24-26页
   ·基于状态抽象的自动分层第26-31页
     ·聚类分析第26-28页
     ·相关聚类参数的定义第28-30页
     ·基于探索信息的自适应聚类算法第30-31页
   ·动作选择策略的改进第31-33页
   ·仿真实验第33-34页
   ·本章小结第34-36页
第四章 基于探索信息自适应聚类的动态分层强化学习第36-50页
   ·基于时态抽象的自动分层第36-37页
   ·初始分层结构的自动生成第37-38页
   ·最优策略的搜索第38-41页
   ·分层结构的动态调整第41-42页
   ·DHRL-ACEI算法的总体流程第42-44页
   ·DHRL-ACEI算法的性能分析第44页
   ·仿真试验与结果分析第44-49页
   ·本章小结第49-50页
第五章 结论与展望第50-52页
   ·结论第50-51页
   ·展望第51-52页
参考文献第52-58页
致谢第58-59页
攻读硕士学位期间主要的研究成果第59页

论文共59页,点击 下载论文
上一篇:罩式炉退火过程控制系统研究与应用
下一篇:基于饱和方法的非线性系统镇定设计