首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于层次化激励学习的自动任务分解

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-15页
   ·本课题的研究背景及意义第9-10页
   ·本课题研究领域的研究动态第10-12页
     ·层次化学习相关研究进展第10-11页
     ·层次化激励学习相关研究进展第11-12页
   ·本文主要研究内容第12-13页
   ·本文的组织结构第13-15页
第2章 层次化激励学习理论框架第15-29页
   ·激励学习第15-22页
     ·发展背景第15-16页
     ·激励学习的基本原理第16-18页
     ·学习算法第18-20页
     ·函数逼近第20-22页
   ·层次化激励学习理论第22-28页
     ·层次化激励学习的基本思想及其发展第23-25页
     ·层次化激励学习方法第25-28页
   ·本章小结第28-29页
第3章 简单随机模型下自动寻找子目标第29-42页
   ·McGovern的基于多实例学习的自动寻找子任务方法第29-31页
   ·一类简单随机模型下自动寻找子目标的方法第31-36页
     ·学习策略模型方法的改进第31-33页
     ·自动寻找子目标方法的改进第33-36页
   ·简单模型下自动寻找子目标的仿真实验第36-41页
     ·Reinforcement Learning工具箱第36-37页
     ·策略模型学习方法的仿真实验第37-40页
     ·自动寻找子目标方法的验证第40-41页
   ·本章小结第41-42页
第4章 复杂随机模型下自动寻找子目标第42-46页
   ·复杂随机模型下自动创建有效子目标第42-44页
   ·复杂模型下自动创建子目标的仿真实眼第44-45页
   ·本章小结第45-46页
第5章 子目标策略的自动形成第46-51页
   ·一类基于启发式策略的激励学习算法第46-48页
   ·自动形成层次化策略第48-49页
   ·仿真实验第49-50页
   ·本章小结第50-51页
结论与展望第51-53页
参考文献第53-57页
致谢第57-58页
附录 A (攻读硕士学位期间发表论文目录)第58-59页
附录 B (攻读硕士学位期间参与研究的科研项目)第59页

论文共59页,点击 下载论文
上一篇:非规则重复累积码的构造研究
下一篇:多域环境下访问控制模型及其安全策略研究