首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文--智能机器人论文

基于Markov决策理论的足球机器人协同机制研究

摘要第1-6页
ABSTRACT第6-9页
第1章 绪论第9-18页
   ·多智能体系统简介第9-11页
     ·人工智能与多智能体第9-11页
     ·多智能体系统特点第11页
   ·机器人足球比赛简介第11-13页
     ·概述第11-12页
     ·机器人足球比赛特点第12-13页
     ·足球机器人决策第13页
   ·研究现状第13-16页
     ·多智能体系统研究内容第13-15页
     ·足球智能体决策研究现状第15-16页
   ·文章主要内容和安排第16-18页
第2章 背景知识第18-30页
   ·Markov决策过程第18-24页
     ·Markov决策过程模型介绍第19-22页
     ·值函数和策略第22-24页
     ·半马尔可夫决策过程第24页
   ·Markov决策过程经典求解方法第24-28页
     ·后向迭代算法第25-26页
     ·前向搜索算法第26-28页
   ·大规模不确定Markov决策过程问题第28-29页
   ·本章小结第29-30页
第3章 基于效用预测的球员策略选择第30-43页
   ·问题来源第30-31页
   ·决策系统基本框架第31-34页
     ·机器人足球决策系统第31-33页
     ·博弈论基本概念第33-34页
   ·基于一步行为效用预测的角色实现第34-39页
     ·辐射区域第34-35页
     ·效用函数的设计第35-37页
     ·角色动作选择第37-39页
   ·FIRA 2D平台上的实验和结果第39-42页
     ·FIRA 2D仿真平台简介第39-40页
     ·实验及结果第40-42页
   ·本章小结第42-43页
第4章 基于MAXQ分解的决策规划第43-59页
   ·任务层次分解方法第43-48页
     ·基于MAXQ的任务层次分解第43-46页
     ·投影值函数分解第46-47页
     ·MAXQ任务分解方法讨论第47-48页
   ·受限感知和通信的多智能体决策系统框架第48-52页
     ·基于贝叶斯估计的状态更新第48-50页
     ·受限通信的多智能体决策框架第50-52页
   ·实时分层策略求解第52-57页
     ·策略求解方法概述第52-53页
     ·基于与或图的策略表示第53-54页
     ·分层策略求解算法第54-56页
     ·完成函数计算第56-57页
   ·本章小结第57-59页
第5章 分层策略求解方法在RoboCup 2D球队决策中的应用第59-75页
   ·RoboCup 2D仿真平台第59-62页
     ·平台简介第59-61页
     ·平台特点第61-62页
   ·智能体决策框架第62-64页
   ·基于MAXQ任务层次分解的决策问题建模第64-71页
     ·问题的基本MDP建模第64-65页
     ·任务层次分解第65-67页
     ·求解过程第67-69页
     ·策略生成器第69-70页
     ·分层值函数计算第70-71页
   ·RoboCup 2D决策实验第71-74页
     ·策略质量与决策深度关系实验第72-73页
     ·任务层次分解算法实验第73-74页
   ·本章小结第74-75页
第6章 结论与展望第75-76页
   ·结论第75页
   ·展望第75-76页
参考文献第76-81页
致谢第81-82页
攻读学位期间参加的科研项目和成果第82页

论文共82页,点击 下载论文
上一篇:基于线性双子支持向量机的特征选择研究及应用
下一篇:六自由度工业机器人的NURBS曲线插补算法的研究