首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

不确定环境下的序列决策问题研究

摘要第1-8页
ABSTRACT第8-10页
第一章 绪论第10-19页
   ·研究背景第10-12页
   ·国内外研究现状第12-17页
     ·MDP研究现状第13页
     ·POMDP研究现状第13-15页
     ·DEC-POMDP研究现状第15-17页
   ·论文研究内容第17-18页
   ·论文组织结构第18-19页
第二章 马尔科夫决策理论第19-32页
   ·MDP基本模型及典型算法第19-20页
     ·基本模型第19-20页
     ·典型算法第20页
   ·POMDP基本模型及算法第20-28页
     ·基本模型第21-23页
     ·精确求解算法第23-26页
     ·近似求解算法第26-28页
   ·DEC-POMDP基本模型及算法第28-31页
     ·基本模型第29页
     ·典型算法第29-31页
   ·本章小结第31-32页
第三章 基于遗传策略的POMDP值迭代算法第32-48页
   ·基本值迭代算法第32-35页
     ·值函数在POMDP中的表示第32-33页
     ·值迭代算法的表示第33-35页
   ·基于遗传策略的值迭代算法第35-43页
     ·随机迭代过程第35-36页
     ·效用矩阵及其更新第36-38页
     ·信念状态的更新第38-41页
     ·算法表示第41-42页
     ·算法分析第42-43页
   ·Tag问题和Hallway2 问题的求解第43-47页
   ·本章小结第47-48页
第四章 应用改进的遗传算法求解DEC-POMDP问题第48-63页
   ·基本遗传算法求解DEC-POMDP问题的难点第48-49页
   ·遗传算法的改进第49-59页
     ·最佳收益态和最佳起始态第50-52页
     ·编码、交叉及变异第52-53页
     ·适应度函数第53-56页
     ·最佳收益态之间的转换策略第56-57页
     ·算法描述及复杂性分析第57-59页
   ·算法可行性验证第59-62页
   ·本章小结第62-63页
第五章 总结与展望第63-65页
   ·工作总结第63-64页
   ·研究展望第64-65页
致谢第65-66页
参考文献第66-72页
作者在学期间取得的学术成果第72页

论文共72页,点击 下载论文
上一篇:多传感器信息融合中的空间配准技术研究
下一篇:半监督学习方法研究