首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

POMDP近似算法的研究与设计

摘要第5-6页
Abstract第6页
第1章 绪论第13-19页
    1.1 引言第13-14页
    1.2 POMDP研究现状与主要算法第14-16页
        1.2.1 精确算法第14-15页
        1.2.2 近似算法第15-16页
    1.3 本文工作第16-17页
    1.4 文章结构第17-19页
第2章 POMDP介绍第19-25页
    2.1 MDP模型第19-22页
        2.1.1 模型定义第19-20页
        2.1.2 性能准则第20页
        2.1.3 策略第20页
        2.1.4 求解第20-22页
    2.2 POMDP模型第22-24页
        2.2.1 模型定义第22页
        2.2.2 性能准则第22-23页
        2.2.3 策略第23页
        2.2.4 信念状态第23-24页
        2.2.5 求解第24页
    2.3 本章小结第24-25页
第3章 基于迭代函数和基于点的近似算法第25-37页
    3.1 基于迭代函数的近似算法第25-29页
        3.1.1 最优值函数的上下界第25-26页
        3.1.2 基于MDP的近似第26-27页
        3.1.3 快速告知边界法第27页
        3.1.4 基于完全不可观测MDP的近似第27-28页
        3.1.5 Blind policy第28-29页
    3.2 基于点的近似算法第29-35页
        3.2.1 基于点算法的主要思想第29-30页
        3.2.2 基于点的值迭代第30-31页
        3.2.3 Perseus算法第31-32页
        3.2.4 启发式搜索值迭代第32-33页
        3.2.5 前向搜索值迭代第33-34页
        3.2.6 最优策略下可达空间的连续近似第34-35页
    3.3 本章小结第35-37页
第4章 下界近似算法-相关状态更新第37-47页
    4.1 引言第37页
    4.2 可达信念状态空间第37-38页
    4.3 相关状态更新法第38-40页
    4.4 状态采样第40-42页
    4.5 近似值迭代第42-43页
    4.6 利用拓扑结构加速迭代第43-45页
    4.7 本章小结第45-47页
第5章 多路启发式搜索值迭代第47-55页
    5.1 引言第47页
    5.2 值函数上下界第47-48页
    5.3 启发式搜索值迭代第48-49页
    5.4 信念状态空间选择第49页
    5.5 多路启发式搜索值迭代第49-53页
        5.5.1 信念点选择第49-50页
        5.5.2 信念点的剪枝第50-51页
        5.5.3 算法描述第51-52页
        5.5.4 算法收敛性第52-53页
    5.6 本章小结第53-55页
第6章 实验与分析第55-65页
    6.1 问题模型第55-59页
        6.1.1 Hallway第55-56页
        6.1.2 Hallway2第56页
        6.1.3 RockSample(4,4)第56-57页
        6.1.4 Tag第57-58页
        6.1.5 Underwater Navigation第58-59页
    6.2 实验结果第59-63页
    6.3 实验分析第63-64页
    6.4 本章小结第64-65页
第7章 总结与展望第65-67页
    7.1 本文工作总结第65-66页
    7.2 展望第66-67页
参考文献第67-71页
致谢第71-73页
在读期间发表的学术论文与取得的研究成果第73页

论文共73页,点击 下载论文
上一篇:Markov跳变系统的分层控制问题研究
下一篇:基于DSP的固定场景视频消抖快速算法研究与实现