基于马氏决策理论的智能体决策问题研究

摘要	第1-6页
ABSTRACT	第6-14页
第一章绪论	第14-19页
·引言	第14-15页
·不确定环境下的智能体决策	第15-16页
·机器人足球2D仿真比赛	第16-17页
·GDUT_TiJi机器人足球2D仿真队	第17-18页
·论文的内容和组织结构	第18-19页
第二章马尔科夫决策理论	第19-33页
·马尔科夫决策过程	第19-25页
·基本模型	第19-20页
·外界环境状态	第20页
·动作集	第20-21页
·状态转移函数	第21页
·回报函数	第21-22页
·值函数与策略求解	第22-23页
·MDP典型算法	第23-25页
·部分可观马尔科夫决策过程	第25-30页
·观察集合	第27页
·信念状态	第27-28页
·策略与值函数表示	第28-29页
·POMDP策略求解	第29-30页
·分布式部分可观马尔科夫决策过程	第30-32页
·本章小结	第32-33页
第三章基于MDP模型的智能体决策	第33-44页
·机器人足球2D仿真决策体系	第33-34页
·机器人足球2D仿真中进攻策略	第34-36页
·基于MDP的进攻策略问题建模	第36-39页
·状态空间表示	第36-37页
·动作空间表示	第37-38页
·状态转移函数	第38-39页
·回报函数	第39页
·持球进攻策略的求解	第39-41页
·实验及分析	第41-42页
·小结	第42-44页
第四章基于POMDP的守门员策略研究	第44-57页
·机器人足球2D仿真守门员决策	第44-45页
·守门员决策存在问题与分析	第45-49页
·基于POMDP模型的守门员决策研究	第49-53页
·状态空间表示	第49-50页
·动作空间表示	第50-51页
·状态转移函数	第51-52页
·观察集合	第52页
·观察函数	第52页
·信念空间	第52页
·回报函数	第52-53页
·策略求解	第53页
·基于临界状态的POMDP求解方法	第53-55页
·实验及分析	第55-56页
·小结	第56-57页
第五章多智能体系统决策问题研究	第57-70页
·多智能体系统决策	第57-58页
·DEC-POMDP模型与求解	第58-63页
·DEC-POMDP求解思路	第59-61页
·DEC-POMDP离线规划的求解算法	第61-63页
·分组有限空间离线规划算法	第63-65页
·实验及结论	第65-68页
·标准测试问题集	第65-66页
·MADP工具箱	第66页
·多智能体系统规划实验	第66-68页
·实验及分析	第68页
·小结	第68-70页
结论与展望	第70-72页
参考文献	第72-76页
攻读学位期间发表的论文	第76-78页
致谢	第78页