首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

关系强化学习的研究与应用

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-14页
   ·研究背景第9-11页
   ·强化学习的发展第11-12页
   ·本文主要研究内容第12-14页
第二章 强化学习第14-25页
   ·强化学习模型第14-17页
     ·值迭代第15-16页
     ·策略迭代第16页
     ·改进的值迭代和策略迭代第16-17页
   ·无模型的策略学习第17-19页
     ·TD 算法第17-18页
     ·Q 学习算法第18-19页
   ·基于模型的策略学习第19-21页
     ·DYNA 算法第19-20页
     ·优先扫描序列第20-21页
   ·大状态空间问题的解决方法第21-24页
     ·近似技术第22页
     ·分层技术第22页
     ·因素化表述技术第22-24页
     ·其他抽象技术第24页
   ·本章小结第24-25页
第三章 关系强化学习的研究与改进第25-41页
   ·研究关系强化学习的必要性第25-26页
   ·关系型MDP第26-28页
     ·关系的表述第26-27页
     ·逻辑抽象和分割第27-28页
   ·一阶逻辑谓词决策树的构建第28-32页
     ·一般决策树的构建第28-30页
     ·逻辑决策树的构建第30-32页
   ·逻辑树和Q 算法的结合第32-35页
   ·改进的关系型强化学习第35-39页
     ·原算法缺点分析第35-36页
     ·增量算法改进第36页
     ·候选谓词算法改进第36-39页
   ·对比实验及算法分析第39-40页
     ·固定积木实验第39-40页
     ·变化积木实验第40页
   ·本章小结第40-41页
第四章 基于强化学习的自主驾驶系统第41-53页
   ·智能车概述第41-42页
   ·智能车避障模型第42-44页
   ·各模块研究第44-48页
     ·状态分析模块第44-47页
     ·知识库系统第47-48页
   ·实验第48-52页
     ·实验设置第48-50页
     ·实验及结果分析第50-52页
   ·本章小结第52-53页
第五章 结论与展望第53-54页
   ·结论第53页
   ·进一步工作第53-54页
参考文献第54-58页
致谢第58-59页
附录(攻读硕士学位期间发表论文及参与的科研项目)第59页

论文共59页,点击 下载论文
上一篇:智能家居远程监控系统的研究与设计
下一篇:模糊神经网络的学习算法的设计