提要 | 第1-7页 |
第一章 引言 | 第7-19页 |
·经典智能规划问题描述 | 第9-14页 |
·状态模型描述 | 第14-17页 |
·所有状态模型及其解的概述 | 第14-15页 |
·马尔可夫决策过程 | 第15-16页 |
·Race Track问题(跑道问题) | 第16-17页 |
·本文工作 | 第17-19页 |
第二章 不确定性智能规划的典型算法 | 第19-35页 |
·值迭代算法和策略迭代算法 | 第19-20页 |
·值迭代算法 | 第19-20页 |
·策略迭代算法 | 第20页 |
·RTDP算法和LRTDP算法 | 第20-26页 |
·实时DP算法 | 第21-22页 |
·Trial-Based RTDP 算法 | 第22-24页 |
·LRTDP算法 | 第24-26页 |
·一般性启发式算法 | 第26-32页 |
·一般性启发式算法框架 Find-and-Revise | 第26-28页 |
·算法 HDP | 第28-30页 |
·算法LDFS | 第30-32页 |
·带循环的AO*算法 LAO*算法 | 第32-33页 |
·算法分析 | 第33-35页 |
第三章 经典算法RTDP收敛性的改进 | 第35-47页 |
·从LRTA*算法到LRTA*(k)算法 | 第35-38页 |
·LRTA*算法是RTDP算法的非概率版本 | 第35-36页 |
·LRTA*(k)算法 | 第36-38页 |
·RTDP收敛性的改进算法RTDP(k) | 第38-47页 |
·启发值改变的传播策略 | 第39-41页 |
·RTDP(k)算法 | 第41-45页 |
·实验结果 | 第45-47页 |
第四章 鲁棒性不确定性智能规划 | 第47-60页 |
·最好模型和最坏模型 | 第48-51页 |
·不确定马尔可夫模型 | 第48-49页 |
·最好模型和最坏模型 | 第49-51页 |
·鲁棒性HDP算法(rHDP) | 第51-56页 |
·算法 | 第51-54页 |
·实验结果 | 第54-56页 |
·鲁棒性LAO*算法(rLAO*) | 第56-60页 |
·算法 | 第56-58页 |
·实验结果 | 第58-60页 |
第五章 总结与展望 | 第60-61页 |
参考文献 | 第61-64页 |
摘要 | 第64-67页 |
Abstract | 第67-70页 |
致谢 | 第70-71页 |
导师及作者简介 | 第71页 |