基于模仿学习的策略学习方法研究

摘要	第4-5页
ABSTRACT	第5页
第一章绪论	第7-20页
1.1 引言	第7-8页
1.2 强化学习	第8-11页
1.3 模仿学习	第11-18页
1.4 待研究问题	第18-19页
1.5 本文工作和组织结构	第19-20页
第二章 "AngryBird"游戏与单步示例策略学习	第20-26页
2.1 引言	第20页
2.2 相关工作	第20-21页
2.3 本文方法	第21-24页
2.4 实验	第24-25页
2.5 总结	第25-26页
第三章 "Ms.PacMan"游戏与多步示例策略学习	第26-39页
3.1 引言	第26-27页
3.2 相关工作	第27-28页
3.3 本文方法	第28-31页
3.4 实验	第31-38页
3.5 总结	第38-39页
第四章基于自生成样本学习的奖赏塑形方法	第39-51页
4.1 引言	第39-40页
4.2 相关工作	第40-41页
4.3 本文方法	第41-46页
4.4 实验	第46-50页
4.5 总结	第50-51页
第五章结束语	第51-53页
参考文献	第53-64页
致谢	第64-65页
附录	第65-66页