首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于模型知识的大空间强化学习算法的研究与实现

摘要第1-6页
ABSTRACT第6-7页
致谢第7-12页
第一章 绪论第12-28页
   ·Agent技术第12-17页
     ·智能Agent第13-17页
   ·多Agent系统(MAS)第17-20页
   ·机器学习第20-23页
     ·机器学习的主要策略第20-21页
     ·机器学习系统的基本结构第21-23页
   ·RoboCup机器人足球赛第23-27页
     ·起源及发展第23-24页
     ·MAS与RoboCup第24-27页
   ·本文组织第27-28页
第二章 强化学习第28-40页
   ·强化学习简介第28-32页
   ·常见的强化学习算法第32-34页
     ·TD算法第32-33页
     ·Q学习第33页
     ·Sarsa学习算法第33页
     ·Dyna-Q算法第33-34页
   ·多agent强化学习第34-37页
   ·其他形式的强化学习第37-39页
     ·部分感知马氏决策过程中的强化学习第37-38页
     ·分层强化学习第38-39页
   ·本章小结第39-40页
第三章 基于模型的强化学习算法第40-46页
   ·Q学习第40-41页
   ·基于模型的Q学习第41-43页
     ·学习环境模型第42-43页
     ·应用模型进行Q学习第43页
   ·实验分析及结论第43-45页
     ·问题描述第43-44页
     ·实验结果分析第44-45页
   ·本章小结第45-46页
第四章 改进的模糊强化学习算法第46-56页
   ·模糊逻辑及模糊推理第46-50页
     ·模糊集合第46-47页
     ·模糊逻辑第47-48页
     ·模糊推理第48-49页
     ·模糊推理系统第49-50页
   ·模糊推理系统的Q学习第50页
   ·遗传算法选取隶属函数的Fuzzy Q学习第50-52页
   ·RoboCup中的踢球问题第52-55页
     ·问题描述第52-53页
     ·问题求解第53-55页
     ·实验结果及分析第55页
   ·本章小结第55-56页
第五章 总结及展望第56-57页
   ·本文工作总结第56页
   ·下一步的工作展望第56-57页
参考文献第57-61页
研究生期间主要科研工作及成果第61页

论文共61页,点击 下载论文
上一篇:一体化网络中基于bonding的终端多家乡研究与实现
下一篇:基于LDPC的纠错密码研究与设计