首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于混合抽象机制的多智能体系统动态分层强化学习算法研究

摘要第1-6页
Abstract第6-11页
第一章 绪论第11-22页
   ·研究背景与意义第11-12页
   ·国内外研究现状第12-18页
     ·强化学习的常用方法第12-14页
     ·大规模学习的“维度灾难”问题第14-15页
     ·自动分层方法第15-18页
   ·本文研究内容第18-19页
   ·论文构成第19-22页
第二章 未知环境中智能体的自动分层问题第22-36页
   ·强化学习第22-26页
   ·分层强化学习的实现第26-27页
   ·典型的分层强化学习方法第27-33页
     ·Option分层强化学习方法第27-29页
     ·HAM分层强化学习方法第29-31页
     ·MAXQ分层强化学习方法第31-32页
     ·分层强化学习方法的比较第32-33页
   ·动态分层的必要性和可行性分析第33-35页
   ·本章小结第35-36页
第三章 基于模型的分层强化学习算法第36-54页
   ·MAXQ分层框架和基于模型的学习相结合的必要性分析第36-37页
   ·基于贝叶斯学习的强化学习第37-40页
   ·基于模型的分层强化学习算法第40-46页
     ·基于模型的分层强化学习算法的实现第40-44页
     ·Bayesian-MAXQ算法的学习第44-46页
   ·仿真实验与分析第46-53页
     ·仿真环境的建立第46-50页
     ·仿真结果分析第50-53页
   ·小结第53-54页
第四章 基于概率模型的动态分层强化学习第54-77页
   ·基于概率模型的动态分层问题第54-57页
   ·基于模型的强化学习第57-58页
   ·DHRL-Model算法的实现第58-66页
     ·子目标点的识别第58-60页
     ·状态子空间的自动划分第60-64页
     ·分层结构的动态调整第64-66页
   ·DHRL-Model算法的流程与性能分析第66-68页
   ·仿真实验与分析第68-76页
   ·小结第76-77页
第五章 基于多种抽象方式融合的多智能体系统自动分层第77-91页
   ·未知环境中多智能体强化学习第77-78页
   ·基于多种抽象方式融合的多智能体系统自动分层方法第78-90页
     ·基于状态抽象的多智能体系统决策空间状态聚类方法第79-84页
     ·基于动作抽象的MAXQ分层结构自动构建方法第84-88页
     ·融合状态抽象和动作抽象的多智能体系统自动分层算法第88-90页
   ·小结第90-91页
第六章 基于探索信息自适应聚类的多智能体动态分层强化学习第91-112页
   ·多智能体系统分层结构的在线调整第91-98页
     ·多智能体系统状态—动作空间探索对分层结构的影响第92-96页
     ·类MAXQ分层结构动态调整算法第96-98页
   ·基于自动分层算法的多智能体系统策略学习第98-104页
     ·策略空间动态分层与动作死锁第98-100页
     ·分层架构下多智能体系统最优策略搜索第100-101页
     ·MADHRL-ACEI算法的流程第101-102页
     ·MADHRL-ACEI算法的性能分析第102-104页
   ·仿真实验与分析第104-111页
   ·小结第111-112页
第七章 结论与展望第112-116页
   ·结论第112-114页
   ·展望第114-116页
参考文献第116-126页
致谢第126-127页
攻读学位期间主要研究成果第127页

论文共127页,点击 下载论文
上一篇:基于CT影像的肺结节病变计算机辅助诊断关键技术研究
下一篇:类别不平衡和误分类代价不等的数据集分类方法及应用