首页--数理科学和化学论文--运筹学论文--对策论(博弈论)论文

部分可观察马氏决策问题的近似规划方法研究

中文摘要第4-5页
abstract第5-6页
第一章 引言第10-17页
    1.1 研究背景及意义第10-12页
    1.2 研究现状第12-14页
    1.3 研究内容第14-15页
    1.4 论文组织结构第15-17页
第二章 背景知识第17-26页
    2.1 马尔科夫决策过程第17-19页
    2.2 POMDP模型第19页
    2.3 信念状态第19-21页
    2.4 值函数与最优策略的计算方法第21-22页
    2.5 POMDP的基本方法第22-25页
        2.5.1 精确值迭代方法第22-23页
        2.5.2 改进的Perseus算法第23-25页
    2.6 本章小结第25-26页
第三章 面向连续空间POMDP问题的高效算法第26-40页
    3.1 策略图第26-28页
    3.2 面向连续空间POMDP问题的高效算法第28-34页
        3.2.1 连续状态空间的表示方法第28-29页
        3.2.2 连续动作空间的表示方法第29页
        3.2.3 连续观察空间的表示方法第29-30页
        3.2.4 GPG算法第30-32页
        3.2.5 算法分析第32-34页
    3.3 实验及结果分析第34-39页
        3.3.1 一维Corridor问题第34-36页
        3.3.2 Intersection问题第36-38页
        3.3.3 Navigation问题第38-39页
    3.4 本章小结第39-40页
第四章 优化的连续状态蒙特卡罗值迭代算法第40-54页
    4.1 蒙特卡罗值迭代算法第40-41页
        4.1.1 蒙特卡罗更新第40-41页
        4.1.2 蒙特卡罗值迭代算法第41页
    4.2 连续状态POMDP问题的优化算法第41-48页
        4.2.1 OMCVI算法第41-48页
        4.2.2 算法分析第48页
    4.3 实验及结果分析第48-53页
        4.3.1 一维Corridor问题第49-51页
        4.3.2 Music-Chair问题第51-53页
    4.4 本章小结第53-54页
第五章 连续状态大规模观察空间的银杏叶搜索算法第54-65页
    5.1 基于试验的异步值迭代算法第54-58页
        5.1.1 基于试验的搜索和银杏叶搜索第54-55页
        5.1.2 HSVI2算法第55-57页
        5.1.3 SARSOP算法第57-58页
    5.2 连续状态大规模观察空间的银杏叶搜索算法第58-61页
        5.2.1 GLS算法第58-61页
        5.2.2 算法分析第61页
    5.3 实验及结果分析第61-64页
        5.3.1 Gantry Crane问题第62-64页
    5.4 本章小结第64-65页
第六章 总结与展望第65-67页
    6.1 总结第65-66页
    6.2 展望第66-67页
参考文献第67-74页
攻读硕士学位期间公开发表(录用)的论文及参与的项目第74-75页
    一、公开发表(录用)的学术论文第74页
    二、参加的科研项目第74-75页
致谢第75-77页

论文共77页,点击 下载论文
上一篇:掺杂M型铁氧体磁学、电学以及磁电耦合性质研究
下一篇:基于分段矢量量化的时间序列分类研究