首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于TileCoding的函数逼近强化学习研究

中文摘要第1-5页
Abstract第5-8页
第一章 引言第8-13页
   ·选题背景与意义第8-9页
   ·国内外研究现状第9-11页
     ·国外研究现状第9-10页
     ·国内研究现状第10-11页
   ·论文主要研究内容第11-12页
   ·文章内容安排第12-13页
第二章 理论基础第13-22页
   ·函数逼近第13-15页
   ·TD下的函数逼近第15-18页
     ·线性函数第17-18页
     ·目标函数第18页
   ·Q学习下的函数逼近第18-21页
   ·本章小结第21-22页
第三章 TileCoding第22-31页
   ·SparseCoarseCoding第22-24页
     ·Local codes第22-23页
     ·Dense codes第23页
     ·Sparse codes第23-24页
   ·TileCoding第24-28页
     ·Tile状态空间第25-26页
     ·哈希编码第26-27页
     ·智能泛化第27-28页
   ·实验结果与分析第28-30页
   ·本章小结第30-31页
第四章 基于TileCoding的强化学习第31-42页
   ·神经网络第31-35页
     ·CMAC网络第31-33页
     ·RBF网络第33-34页
     ·MLP网络第34-35页
   ·强化学习第35-40页
     ·强化学习基础理论第36-39页
     ·强化学习经典算法第39-40页
   ·基于TileCoding的强化学习第40-41页
   ·本章小结第41-42页
第五章 Mountain Car第42-46页
   ·仿真实验第42页
   ·实验分析第42-43页
   ·敛散性分析第43-45页
   ·本章小结第45-46页
第六章 总结与展望第46-48页
   ·工作总结第46-47页
   ·工作展望第47-48页
参考文献第48-52页
致谢第52页

论文共52页,点击 下载论文
上一篇:基于ARM的便携式电池检测设备
下一篇:并行强化学习研究