基于性能势的智能体学习与规划方法研究

摘要	第1-6页
ABSTRACT	第6-8页
目录	第8-10页
CONTENTS	第10-12页
第一章绪论	第12-18页
·研究背景	第12-15页
·智能规划概述	第12-13页
·大规模不确定性规划问题	第13-14页
·分布式人工智能	第14-15页
·研究平台	第15-17页
·RoboCup简介	第15页
·机器人足球仿真平台的介绍	第15-16页
·GDUT_TiJi机器人足球2D仿真队简介	第16-17页
·小结及本文章节安排	第17-18页
第二章性能势与平均强化学习算法理论	第18-26页
·引言	第18页
·半马尔科夫决策过程概述	第18-21页
·MDP基本模型及概念	第18-20页
·Option理论	第20-21页
·马尔科夫系统与性能势理论	第21-23页
·强化学习概述	第23-26页
·强化学习理论基础	第23-24页
·平均型MDP的强化学习	第24-26页
第三章基于性能势的A~*平均奖赏强化学习	第26-34页
·引言	第26页
·相关概念	第26-29页
·G-learning算法	第26-27页
·基于启发式搜索的规划算法	第27-28页
·基于启发式搜索的A~*规划算法	第28-29页
·基于性能势的A~*平均奖赏强化学习算法	第29-31页
·实验测试与结果分析	第31-33页
·Reinforcement learning标准测试工具箱	第31页
·实验测试与分析	第31-33页
·小结	第33-34页
第四章基于GA~*-learning的多智能体决策问题研究	第34-41页
·引言	第34页
·基于Option理论的行为模型设计	第34-37页
·实验及结论	第37-40页
·Keepaway足球仿真平台	第37页
·实验及分析	第37-40页
·小结	第40-41页
总结与展望	第41-43页
总结	第41页
展望	第41-43页
参考文献	第43-47页
攻读学位期间发表的论文	第47-49页
致谢	第49页