实用POMDP近似求解算法的研究

摘要	第1-7页
Abstract	第7-12页
第1章绪论	第12-28页
·研究背景	第12-13页
·POMDP 问题研究的发展现状	第13-21页
·POMDP 问题求解算法的发展	第13-21页
·相关技术的发展现状	第21-25页
·基于采样的方法	第21-23页
·POMDP 模型的因子化表示	第23-24页
·POMDP 策略的层级表示	第24-25页
·本课题研究的意义及主要研究内容	第25-28页
·本课题研究的意义	第25-26页
·应用背景	第26-27页
·主要研究内容	第27-28页
第2章 POMDP 模型描述与求解算法	第28-48页
·MDP 模型	第28-32页
·模型描述	第28-30页
·求解算法	第30-32页
·POMDP 模型	第32-47页
·模型描述	第32-34页
·求解算法	第34-40页
·主要的精确算法概述	第40-47页
·POMDP 算法的复杂性	第47页
·本章小结	第47-48页
第3章基于实例的POMDP 问题的近似求解	第48-61页
·引言	第48页
·基于实例(Instance-based)的方法	第48-49页
·启发式算法	第49-51页
·MLS 算法	第50页
·Q-MDP 算法	第50-51页
·其他的启发式算法	第51页
·增强学习	第51-53页
·基于实例的近似求解算法	第53-60页
·NNI 算法	第53-57页
·ENNI 算法	第57-59页
·结合局部加权回归算法的LWI 算法	第59-60页
·本章小结	第60-61页
第4章基于核信念的值迭代算法	第61-76页
·引言	第61页
·基于信念点的算法	第61-67页
·采样信念点	第61-62页
·值向量的DP 备份更新	第62-64页
·PBVI 算法	第64-65页
·PERSEUS 算法	第65-67页
·基于核信念的值迭代算法	第67-74页
·采样过程	第67-70页
·值向量的DP 备份更新	第70-71页
·稀疏量的处理	第71-72页
·收敛性与误差界限	第72-74页
·本章小结	第74-76页
第5章 POMDP模型运行平台与算法的性能测试	第76-83页
·POMDP 模型运行平台概述	第76-78页
·环境模型	第76-77页
·Agent 模型	第77-78页
·性能测试的模型	第78-79页
·基于实例的算法的性能分析	第79-80页
·基于核信念的值迭代算法的性能分析	第80-82页
·不同算法的性能对比	第80-81页
·不同采样策略的性能对比	第81-82页
·本章小结	第82-83页
结论	第83-85页
参考文献	第85-99页
攻读硕士学位期间发表的论文	第99-101页
致谢	第101页