POMDP近似算法的研究与设计

摘要	第5-6页
Abstract	第6页
第1章绪论	第13-19页
1.1 引言	第13-14页
1.2 POMDP研究现状与主要算法	第14-16页
1.2.1 精确算法	第14-15页
1.2.2 近似算法	第15-16页
1.3 本文工作	第16-17页
1.4 文章结构	第17-19页
第2章 POMDP介绍	第19-25页
2.1 MDP模型	第19-22页
2.1.1 模型定义	第19-20页
2.1.2 性能准则	第20页
2.1.3 策略	第20页
2.1.4 求解	第20-22页
2.2 POMDP模型	第22-24页
2.2.1 模型定义	第22页
2.2.2 性能准则	第22-23页
2.2.3 策略	第23页
2.2.4 信念状态	第23-24页
2.2.5 求解	第24页
2.3 本章小结	第24-25页
第3章基于迭代函数和基于点的近似算法	第25-37页
3.1 基于迭代函数的近似算法	第25-29页
3.1.1 最优值函数的上下界	第25-26页
3.1.2 基于MDP的近似	第26-27页
3.1.3 快速告知边界法	第27页
3.1.4 基于完全不可观测MDP的近似	第27-28页
3.1.5 Blind policy	第28-29页
3.2 基于点的近似算法	第29-35页
3.2.1 基于点算法的主要思想	第29-30页
3.2.2 基于点的值迭代	第30-31页
3.2.3 Perseus算法	第31-32页
3.2.4 启发式搜索值迭代	第32-33页
3.2.5 前向搜索值迭代	第33-34页
3.2.6 最优策略下可达空间的连续近似	第34-35页
3.3 本章小结	第35-37页
第4章下界近似算法-相关状态更新	第37-47页
4.1 引言	第37页
4.2 可达信念状态空间	第37-38页
4.3 相关状态更新法	第38-40页
4.4 状态采样	第40-42页
4.5 近似值迭代	第42-43页
4.6 利用拓扑结构加速迭代	第43-45页
4.7 本章小结	第45-47页
第5章多路启发式搜索值迭代	第47-55页
5.1 引言	第47页
5.2 值函数上下界	第47-48页
5.3 启发式搜索值迭代	第48-49页
5.4 信念状态空间选择	第49页
5.5 多路启发式搜索值迭代	第49-53页
5.5.1 信念点选择	第49-50页
5.5.2 信念点的剪枝	第50-51页
5.5.3 算法描述	第51-52页
5.5.4 算法收敛性	第52-53页
5.6 本章小结	第53-55页
第6章实验与分析	第55-65页
6.1 问题模型	第55-59页
6.1.1 Hallway	第55-56页
6.1.2 Hallway2	第56页
6.1.3 RockSample(4,4)	第56-57页
6.1.4 Tag	第57-58页
6.1.5 Underwater Navigation	第58-59页
6.2 实验结果	第59-63页
6.3 实验分析	第63-64页
6.4 本章小结	第64-65页
第7章总结与展望	第65-67页
7.1 本文工作总结	第65-66页
7.2 展望	第66-67页
参考文献	第67-71页
致谢	第71-73页
在读期间发表的学术论文与取得的研究成果	第73页