首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于马氏决策理论的智能体决策问题研究

摘要第1-6页
ABSTRACT第6-14页
第一章 绪论第14-19页
   ·引言第14-15页
   ·不确定环境下的智能体决策第15-16页
   ·机器人足球2D仿真比赛第16-17页
   ·GDUT_TiJi机器人足球2D仿真队第17-18页
   ·论文的内容和组织结构第18-19页
第二章 马尔科夫决策理论第19-33页
   ·马尔科夫决策过程第19-25页
     ·基本模型第19-20页
     ·外界环境状态第20页
     ·动作集第20-21页
     ·状态转移函数第21页
     ·回报函数第21-22页
     ·值函数与策略求解第22-23页
     ·MDP典型算法第23-25页
   ·部分可观马尔科夫决策过程第25-30页
     ·观察集合第27页
     ·信念状态第27-28页
     ·策略与值函数表示第28-29页
     ·POMDP策略求解第29-30页
   ·分布式部分可观马尔科夫决策过程第30-32页
   ·本章小结第32-33页
第三章 基于MDP模型的智能体决策第33-44页
   ·机器人足球2D仿真决策体系第33-34页
   ·机器人足球2D仿真中进攻策略第34-36页
   ·基于MDP的进攻策略问题建模第36-39页
     ·状态空间表示第36-37页
     ·动作空间表示第37-38页
     ·状态转移函数第38-39页
     ·回报函数第39页
   ·持球进攻策略的求解第39-41页
   ·实验及分析第41-42页
   ·小结第42-44页
第四章 基于POMDP的守门员策略研究第44-57页
   ·机器人足球2D仿真守门员决策第44-45页
   ·守门员决策存在问题与分析第45-49页
   ·基于POMDP模型的守门员决策研究第49-53页
     ·状态空间表示第49-50页
     ·动作空间表示第50-51页
     ·状态转移函数第51-52页
     ·观察集合第52页
     ·观察函数第52页
     ·信念空间第52页
     ·回报函数第52-53页
     ·策略求解第53页
   ·基于临界状态的POMDP求解方法第53-55页
   ·实验及分析第55-56页
   ·小结第56-57页
第五章 多智能体系统决策问题研究第57-70页
   ·多智能体系统决策第57-58页
   ·DEC-POMDP模型与求解第58-63页
     ·DEC-POMDP求解思路第59-61页
     ·DEC-POMDP离线规划的求解算法第61-63页
   ·分组有限空间离线规划算法第63-65页
   ·实验及结论第65-68页
     ·标准测试问题集第65-66页
     ·MADP工具箱第66页
     ·多智能体系统规划实验第66-68页
     ·实验及分析第68页
   ·小结第68-70页
结论与展望第70-72页
参考文献第72-76页
攻读学位期间发表的论文第76-78页
致谢第78页

论文共78页,点击 下载论文
上一篇:基于ARM和Linux的智能家居网络监控系统研究
下一篇:基于预测的无线传感器网络混合拓扑路由协议