基于点的POMDP策略迭代算法设计与实现

摘要	第5-6页
Abstract	第6-7页
第一章绪论	第12-16页
1.1 研究现状	第12-14页
1.2 本文工作	第14-15页
1.3 本文的组织结构	第15-16页
第二章 MDP与POMDP介绍	第16-31页
2.1 马尔科夫决策过程	第16-18页
2.1.1 问题描述	第16-17页
2.1.2 最优策略求解	第17-18页
2.2 部分可观察马尔科夫决策过程	第18-22页
2.2.1 问题描述	第18-20页
2.2.2 策略求解	第20-22页
2.3 POMDP问题近似求解方法	第22-30页
2.3.1 基于点的求解思路	第22-24页
2.3.2 基于点的值迭代方法	第24-25页
2.3.3 Perseus算法	第25-26页
2.3.4 基于点的策略迭代算法	第26-30页
2.3 本章小结	第30-31页
第三章基于点聚类特征的策略迭代算法	第31-41页
3.1 POMDP模型可达区域	第31-32页
3.2 可达区域点的聚类分析	第32-37页
3.2.1 分析可达区域的实验	第32-35页
3.2.2 基于密度的信念点聚类算法	第35-37页
3.3 考察点的选择	第37-38页
3.4 算法描述	第38-40页
3.5 本章小结	第40-41页
第四章算法实现	第41-50页
4.1 系统总体设计	第41-42页
4.2 模块实现细节	第42-49页
4.2.1 问题模型操作模块	第42-43页
4.2.2 算法模块	第43-47页
4.2.3 性能评估与实用功能模块	第47-49页
4.3 本章小结	第49-50页
第五章实验与分析	第50-57页
5.1 实验问题模型	第50-53页
5.1.1 Tiger-Grid	第50-51页
5.1.2 Hallway	第51页
5.1.3 Rock Sample[5,5]	第51-52页
5.1.4 Tag avoid	第52-53页
5.2 实验结果与分析	第53-56页
5.3 本章小结	第56-57页
第六章总结和展望	第57-59页
6.1 本文工作总结	第57-58页
6.2 展望	第58-59页
参考文献	第59-62页
致谢	第62-64页