首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于性能势的智能体学习与规划方法研究

摘要第1-6页
ABSTRACT第6-8页
目录第8-10页
CONTENTS第10-12页
第一章 绪论第12-18页
   ·研究背景第12-15页
     ·智能规划概述第12-13页
     ·大规模不确定性规划问题第13-14页
     ·分布式人工智能第14-15页
   ·研究平台第15-17页
     ·RoboCup简介第15页
     ·机器人足球仿真平台的介绍第15-16页
     ·GDUT_TiJi机器人足球2D仿真队简介第16-17页
   ·小结及本文章节安排第17-18页
第二章 性能势与平均强化学习算法理论第18-26页
   ·引言第18页
   ·半马尔科夫决策过程概述第18-21页
     ·MDP基本模型及概念第18-20页
     ·Option理论第20-21页
   ·马尔科夫系统与性能势理论第21-23页
   ·强化学习概述第23-26页
     ·强化学习理论基础第23-24页
     ·平均型MDP的强化学习第24-26页
第三章 基于性能势的A~*平均奖赏强化学习第26-34页
   ·引言第26页
   ·相关概念第26-29页
     ·G-learning算法第26-27页
     ·基于启发式搜索的规划算法第27-28页
     ·基于启发式搜索的A~*规划算法第28-29页
   ·基于性能势的A~*平均奖赏强化学习算法第29-31页
   ·实验测试与结果分析第31-33页
     ·Reinforcement learning标准测试工具箱第31页
     ·实验测试与分析第31-33页
   ·小结第33-34页
第四章 基于GA~*-learning的多智能体决策问题研究第34-41页
   ·引言第34页
   ·基于Option理论的行为模型设计第34-37页
   ·实验及结论第37-40页
     ·Keepaway足球仿真平台第37页
     ·实验及分析第37-40页
   ·小结第40-41页
总结与展望第41-43页
 总结第41页
 展望第41-43页
参考文献第43-47页
攻读学位期间发表的论文第47-49页
致谢第49页

论文共49页,点击 下载论文
上一篇:可重构机器人制造单元设备布局研究
下一篇:基于物联网的远程移动医疗监护系统的设计与实现