基于TileCoding的函数逼近强化学习研究

中文摘要	第1-5页
Abstract	第5-8页
第一章引言	第8-13页
·选题背景与意义	第8-9页
·国内外研究现状	第9-11页
·国外研究现状	第9-10页
·国内研究现状	第10-11页
·论文主要研究内容	第11-12页
·文章内容安排	第12-13页
第二章理论基础	第13-22页
·函数逼近	第13-15页
·TD下的函数逼近	第15-18页
·线性函数	第17-18页
·目标函数	第18页
·Q学习下的函数逼近	第18-21页
·本章小结	第21-22页
第三章 TileCoding	第22-31页
·SparseCoarseCoding	第22-24页
·Local codes	第22-23页
·Dense codes	第23页
·Sparse codes	第23-24页
·TileCoding	第24-28页
·Tile状态空间	第25-26页
·哈希编码	第26-27页
·智能泛化	第27-28页
·实验结果与分析	第28-30页
·本章小结	第30-31页
第四章基于TileCoding的强化学习	第31-42页
·神经网络	第31-35页
·CMAC网络	第31-33页
·RBF网络	第33-34页
·MLP网络	第34-35页
·强化学习	第35-40页
·强化学习基础理论	第36-39页
·强化学习经典算法	第39-40页
·基于TileCoding的强化学习	第40-41页
·本章小结	第41-42页
第五章 Mountain Car	第42-46页
·仿真实验	第42页
·实验分析	第42-43页
·敛散性分析	第43-45页
·本章小结	第45-46页
第六章总结与展望	第46-48页
·工作总结	第46-47页
·工作展望	第47-48页
参考文献	第48-52页
致谢	第52页