基于模型知识的大空间强化学习算法的研究与实现

摘要	第1-6页
ABSTRACT	第6-7页
致谢	第7-12页
第一章绪论	第12-28页
·Agent技术	第12-17页
·智能Agent	第13-17页
·多Agent系统(MAS)	第17-20页
·机器学习	第20-23页
·机器学习的主要策略	第20-21页
·机器学习系统的基本结构	第21-23页
·RoboCup机器人足球赛	第23-27页
·起源及发展	第23-24页
·MAS与RoboCup	第24-27页
·本文组织	第27-28页
第二章强化学习	第28-40页
·强化学习简介	第28-32页
·常见的强化学习算法	第32-34页
·TD算法	第32-33页
·Q学习	第33页
·Sarsa学习算法	第33页
·Dyna-Q算法	第33-34页
·多agent强化学习	第34-37页
·其他形式的强化学习	第37-39页
·部分感知马氏决策过程中的强化学习	第37-38页
·分层强化学习	第38-39页
·本章小结	第39-40页
第三章基于模型的强化学习算法	第40-46页
·Q学习	第40-41页
·基于模型的Q学习	第41-43页
·学习环境模型	第42-43页
·应用模型进行Q学习	第43页
·实验分析及结论	第43-45页
·问题描述	第43-44页
·实验结果分析	第44-45页
·本章小结	第45-46页
第四章改进的模糊强化学习算法	第46-56页
·模糊逻辑及模糊推理	第46-50页
·模糊集合	第46-47页
·模糊逻辑	第47-48页
·模糊推理	第48-49页
·模糊推理系统	第49-50页
·模糊推理系统的Q学习	第50页
·遗传算法选取隶属函数的Fuzzy Q学习	第50-52页
·RoboCup中的踢球问题	第52-55页
·问题描述	第52-53页
·问题求解	第53-55页
·实验结果及分析	第55页
·本章小结	第55-56页
第五章总结及展望	第56-57页
·本文工作总结	第56页
·下一步的工作展望	第56-57页
参考文献	第57-61页
研究生期间主要科研工作及成果	第61页