首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

分层强化学习方法研究

第1章 绪论第1-17页
   ·研究动机第12-13页
   ·研究内容第13-14页
   ·论文结构第14-17页
第2章 分层强化学习综述第17-39页
   ·引言第17页
   ·分层强化学习基本原理第17-24页
     ·强化学习第17-21页
     ·半马氏决策过程第21-22页
     ·分层与抽象第22-24页
   ·分层强化学习方法研究现状第24-31页
     ·Option分层强化学习方法第24-27页
     ·HAM分层强化学习方法第27-28页
     ·MAXQ分层强化学习方法第28-30页
     ·比较与分析第30-31页
   ·任务自动分层方法研究现状第31-36页
     ·瓶颈和路标状态法第31-32页
     ·共用子空间法第32-33页
     ·多维状态法第33-34页
     ·马氏空间法第34-35页
     ·其他有关方法第35页
     ·任务自动分层方法评价第35-36页
   ·多智能体分层强化学习研究现状第36-37页
   ·本章小结第37-39页
第3章 OMQ分层强化学习理论框架与学习算法第39-67页
   ·引言第39页
   ·用例描述第39-42页
   ·OMQ理论框架第42-48页
   ·OMQ学习算法第48-51页
   ·OMQ学习算法最优性分析第51-53页
   ·OMQ学习算法收敛性证明第53-59页
   ·OMQ学习算法实验分析第59-66页
     ·OMQ值函数分解过程实例剖析第59-61页
     ·OMQ与Q-学习算法收敛速度对比分析第61-65页
     ·OMQ与Option及MAXQ学习算法性能对比分析第65-66页
   ·本章小结第66-67页
第4章 基于免疫聚类的OMQ任务自动分层算法第67-83页
   ·引言第67页
   ·免疫原理剖析第67-72页
     ·生物免疫机理第68-69页
     ·人工免疫系统第69-72页
   ·基于免疫聚类的Option自动生成算法第72-76页
     ·算法描述第72-74页
     ·实验分析第74-76页
   ·基于二次应答机制的动态分层OMQ算法第76-81页
     ·算法描述第76-78页
     ·实验分析第78-81页
   ·本章小结第81-83页
第5章 未知动态环境中OMQ分层强化学习方法第83-95页
   ·引言第83页
   ·移动机器人路径规划问题第83-85页
   ·未知动态环境中的OMQ分层强化学习算法第85-87页
   ·实验分析第87-92页
   ·与POMDP有关方法的比较第92-94页
   ·本章小结第94-95页
第6章 多智能体OMQ分层强化学习方法第95-109页
   ·引言第95页
   ·多智能体强化学习问题剖析第95-96页
   ·多智能体OMQ分层强化学习框架第96-98页
   ·多智能体OMQ分层强化学习算法第98-100页
   ·实验分析第100-108页
   ·本章小结第108-109页
结论第109-111页
参考文献第111-124页
攻读博士学位期间发表的论文和取得的科研成果第124-126页
致谢第126页

论文共126页,点击 下载论文
上一篇:新型无卡轴木材旋切机的研制
下一篇:综合利用水库实时兴利优化调度研究