不确定性智能规划算法研究

提要	第1-7页
第一章引言	第7-19页
·经典智能规划问题描述	第9-14页
·状态模型描述	第14-17页
·所有状态模型及其解的概述	第14-15页
·马尔可夫决策过程	第15-16页
·Race Track问题（跑道问题）	第16-17页
·本文工作	第17-19页
第二章不确定性智能规划的典型算法	第19-35页
·值迭代算法和策略迭代算法	第19-20页
·值迭代算法	第19-20页
·策略迭代算法	第20页
·RTDP算法和LRTDP算法	第20-26页
·实时DP算法	第21-22页
·Trial-Based RTDP 算法	第22-24页
·LRTDP算法	第24-26页
·一般性启发式算法	第26-32页
·一般性启发式算法框架 Find-and-Revise	第26-28页
·算法 HDP	第28-30页
·算法LDFS	第30-32页
·带循环的AO算法 LAO算法	第32-33页
·算法分析	第33-35页
第三章经典算法RTDP收敛性的改进	第35-47页
·从LRTA算法到LRTA(k)算法	第35-38页
·LRTA*算法是RTDP算法的非概率版本	第35-36页
·LRTA*(k)算法	第36-38页
·RTDP收敛性的改进算法RTDP(k)	第38-47页
·启发值改变的传播策略	第39-41页
·RTDP(k)算法	第41-45页
·实验结果	第45-47页
第四章鲁棒性不确定性智能规划	第47-60页
·最好模型和最坏模型	第48-51页
·不确定马尔可夫模型	第48-49页
·最好模型和最坏模型	第49-51页
·鲁棒性HDP算法（rHDP）	第51-56页
·算法	第51-54页
·实验结果	第54-56页
·鲁棒性LAO算法（rLAO）	第56-60页
·算法	第56-58页
·实验结果	第58-60页
第五章总结与展望	第60-61页
参考文献	第61-64页
摘要	第64-67页
Abstract	第67-70页
致谢	第70-71页
导师及作者简介	第71页