首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于人工势场的激励学习问题研究

摘要第1-6页
ABSTRACT第6-10页
第一章 引言第10-21页
   ·本文研究的背景第10页
   ·激励学习理论与应用综述第10-20页
     ·激励学习研究的背景第11-13页
     ·激励学习算法的研究进展第13-15页
     ·激励学习的泛化方法研究概况第15-17页
     ·激励学习的理论与应用研究进展第17-19页
     ·存在的问题和本文的研究重点第19-20页
   ·本文内容组织结构第20-21页
第二章 激励学习第21-31页
   ·激励学习的理论基础及基本概念第21-25页
     ·马尔可夫决策过程第21-22页
     ·激励学习的几个基本概念第22-24页
     ·激励学习的模型第24-25页
     ·激励学习的目标函数或优化标准第25页
   ·激励学习的基本算法第25-31页
     ·瞬时差分方法第26-27页
     ·Q 学习算法第27-29页
     ·Q 学习存在的问题第29-31页
第三章 人工势场第31-36页
   ·人工势场第31-32页
   ·势函数的选取第32-34页
     ·斥力势函数的选取第32-33页
     ·引力势函数的选取第33-34页
     ·全局势场的生成第34页
   ·应用人工势场法的优缺点第34-36页
     ·人工势场法的优点第35页
     ·人工势场法的缺点第35-36页
第四章 激励势场模型第36-41页
   ·激励势场模型第36-37页
     ·引力源与斥力源集合的定义第36页
     ·引力势场的描述第36-37页
     ·斥力势场的描述第37页
     ·全局激励势场的生成第37页
   ·虚拟水流法第37-39页
   ·激励势场的算法第39-41页
第五章 实验仿真与结果分析第41-55页
   ·完全可观测四房间网格环境第41-45页
     ·问题描述第41-42页
     ·模型描述第42页
     ·应用激励势场模型进行实验的结果第42-43页
     ·与Q 学习进行比较的实验结果第43-45页
   ·部分可观测四房间网格世界环境第45-49页
     ·问题描述第45页
     ·模型描述第45-46页
     ·应用激励势场模型进行实验的结果第46-49页
   ·钥匙与门迷宫问题第49-55页
     ·问题描述第49-50页
     ·模型描述第50-51页
     ·应用激励势场模型进行实验的结果第51-54页
     ·与其它多种学习方法进行比较的实验结果第54-55页
结论与展望第55-56页
 结论第55页
 研究展望第55-56页
参考文献第56-61页
致谢第61-62页
附录(在学习期间完成的学术论文和参加的科研项目)第62页

论文共62页,点击 下载论文
上一篇:具有可变时滞的Hopfield型随机模糊神经网络的稳定性
下一篇:基于群体智能算法的聚类挖掘方法研究