基于Option自动生成的分层强化学习方法研究

摘要	第1-6页
ABSTRACT	第6-10页
第一章绪论	第10-16页
·研究背景和意义	第10-11页
·研究现状	第11-13页
·研究内容	第13-14页
·论文结构	第14-16页
第二章分层强化学习理论基础	第16-29页
·强化学习	第16-22页
·强化学习简介	第16-19页
·强化学习算法	第19-22页
·强化学习有待解决的问题	第22页
·分层强化学习理论	第22-28页
·半马氏决策过程	第22-23页
·分层与抽象	第23-24页
·典型分层强化学习方法	第24-28页
·本章小结	第28-29页
第三章 AOM 分层强化学习理论与算法设计	第29-35页
·实验用例描述	第29-30页
·AOM 理论基础	第30-31页
·AOM 学习算法设计	第31-34页
·算法描述	第31-32页
·算法流程图	第32-33页
·AOM 值函数更新过程	第33-34页
·本章小结	第34-35页
第四章基于蚁群聚类的AOM 任务自动分层算法	第35-48页
·蚁群聚类算法剖析	第35-45页
·蚁群算法	第35-38页
·蚁群聚类算法及其分析	第38-45页
·基于蚁群聚类的 Option 自动生成算法	第45-47页
·本章小结	第47-48页
第五章仿真实验与结果分析	第48-53页
·实验目的及参数设置	第48页
·实验1：具有规则障碍的网格环境	第48-50页
·问题描述	第48-49页
·实验结果	第49-50页
·实验2：具有不规则障碍的网格环境	第50-52页
·问题描述	第50-51页
·实验结果	第51-52页
·实验分析	第52页
·本章小结	第52-53页
结论与展望	第53-54页
参考文献	第54-59页
致谢	第59-60页
附录（攻读硕士学位期间发表论文及参与的科研项目）	第60页