不确定环境下的序列决策问题研究

摘要	第1-8页
ABSTRACT	第8-10页
第一章绪论	第10-19页
·研究背景	第10-12页
·国内外研究现状	第12-17页
·MDP研究现状	第13页
·POMDP研究现状	第13-15页
·DEC-POMDP研究现状	第15-17页
·论文研究内容	第17-18页
·论文组织结构	第18-19页
第二章马尔科夫决策理论	第19-32页
·MDP基本模型及典型算法	第19-20页
·基本模型	第19-20页
·典型算法	第20页
·POMDP基本模型及算法	第20-28页
·基本模型	第21-23页
·精确求解算法	第23-26页
·近似求解算法	第26-28页
·DEC-POMDP基本模型及算法	第28-31页
·基本模型	第29页
·典型算法	第29-31页
·本章小结	第31-32页
第三章基于遗传策略的POMDP值迭代算法	第32-48页
·基本值迭代算法	第32-35页
·值函数在POMDP中的表示	第32-33页
·值迭代算法的表示	第33-35页
·基于遗传策略的值迭代算法	第35-43页
·随机迭代过程	第35-36页
·效用矩阵及其更新	第36-38页
·信念状态的更新	第38-41页
·算法表示	第41-42页
·算法分析	第42-43页
·Tag问题和Hallway2 问题的求解	第43-47页
·本章小结	第47-48页
第四章应用改进的遗传算法求解DEC-POMDP问题	第48-63页
·基本遗传算法求解DEC-POMDP问题的难点	第48-49页
·遗传算法的改进	第49-59页
·最佳收益态和最佳起始态	第50-52页
·编码、交叉及变异	第52-53页
·适应度函数	第53-56页
·最佳收益态之间的转换策略	第56-57页
·算法描述及复杂性分析	第57-59页
·算法可行性验证	第59-62页
·本章小结	第62-63页
第五章总结与展望	第63-65页
·工作总结	第63-64页
·研究展望	第64-65页
致谢	第65-66页
参考文献	第66-72页
作者在学期间取得的学术成果	第72页