首页--数理科学和化学论文--运筹学论文--规划论(数学规划)论文

基于马尔可夫决策理论的规划问题的研究

摘要第1-7页
ABSTRACT第7-9页
目录第9-13页
图表目录第13-15页
第1章 绪论第15-27页
 内容提要第15页
   ·研究背景第15-17页
     ·智能体的概念第15-16页
     ·智能体的认知模型第16页
     ·智能体的体系结构第16-17页
     ·多智能体系统及其应用第17页
   ·研究内容第17-22页
     ·马尔可夫过程第18-19页
     ·相关决策模型第19-21页
     ·大规模不确定性规划问题第21-22页
   ·研究平台第22-25页
     ·Robocup的目标第22-23页
     ·仿真2D平台特点第23页
     ·仿真2D发展回顾第23-25页
   ·主要工作及章节安排第25-27页
第2章 马尔可夫决策基础理论第27-61页
 内容提要第27页
   ·MDP基本模型及概念第27-32页
     ·基本模型第27-28页
     ·状态第28-29页
     ·行动第29页
     ·状态转移函数第29-30页
     ·策略与值函数第30-32页
   ·MDP典型算法第32-36页
     ·反向迭代类算法第33-34页
     ·前向搜索类算法第34-36页
   ·POMDP基本模型及概念第36-42页
     ·基本模型第36-37页
     ·观察第37页
     ·信念状态第37-38页
     ·主观贝叶斯更新第38-40页
     ·策略表示形式第40-41页
     ·值函数表示形式第41-42页
   ·POMDP典型算法第42-48页
     ·值迭代算法第42-47页
     ·搜索类算法第47-48页
   ·多智能体系统相关决策模型第48-50页
     ·DEC-POMDP模型第48-49页
     ·POSG模型及策略表示第49-50页
   ·多智能体系统典型决策算法第50-57页
     ·基于动态规划求解POSG第50-54页
     ·基于搜索的MAA~*算法第54-57页
   ·Option理论第57-59页
     ·半马尔可夫决策过程第57-58页
     ·Option及相关定义第58-59页
   ·小结第59-61页
第3章 仿真2D平台中相关子问题的研究第61-84页
 内容提要第61页
   ·基本介绍第61-63页
     ·仿真2D平台的C/S结构第61-62页
     ·问题的POSG建模第62-63页
     ·智能体的分层设计第63页
   ·观察更新问题第63-68页
     ·身份识别问题描述第63-65页
     ·身份识别算法第65-66页
     ·分步贝叶斯更新第66-68页
   ·行为设计问题第68-80页
     ·原子动作介绍第68-70页
     ·基本MDP求解算法的使用第70-74页
     ·概率分布模型及统计方法的使用第74-77页
     ·无关状态因素的预分析技术第77-80页
     ·模型选择问题第80-83页
     ·问题分析第81页
     ·情景采样评测第81-83页
   ·小结第83-84页
第4章 基于Option理论的分等级规划第84-104页
 内容摘要第84页
   ·基本介绍第84-85页
   ·系统模型及框架第85-96页
     ·因子化表示第86-88页
     ·信念状态的处理第88-90页
     ·立即收益第90-91页
     ·行为生成器第91-96页
   ·决策算法设计第96-101页
     ·Real-Time框架第96-97页
     ·启发式函数第97-99页
     ·分支控制第99-101页
     ·多智能体的配合及对抗第101页
   ·实验效果第101-102页
   ·小结第102-104页
第5章 对基本马尔可夫决策算法的研究第104-121页
 内容摘要第104页
   ·基本介绍第104-105页
   ·实时动态规划算法第105-109页
     ·前向搜索算法的收敛判据第105-106页
     ·Focused RTDP算法第106-109页
   ·增量最优的实时动态规划算法第109-117页
     ·最优行动判据第109-112页
     ·实时分支选择策略第112-113页
     ·实时算法设计第113-114页
     ·在线实验第114-117页
   ·算法的进一步改进第117-119页
     ·异步值迭代第117-118页
     ·针对环的处理第118-119页
     ·离线实验第119页
   ·小结第119-121页
第6章 总结与展望第121-123页
 总结第121页
 未来展望第121-123页
参考文献第123-131页
致谢第131-132页
在读期间发表的学术论文与取得的研究成果第132页

论文共132页,点击 下载论文
上一篇:周期性充气加压对髋关节置换手术后下肢深静脉血栓预防的临床研究
下一篇:国企改革中经理股票期权制度的应用研究--以海南椰树集团为例