| 提要 | 第1-7页 |
| 第一章 引言 | 第7-19页 |
| ·经典智能规划问题描述 | 第9-14页 |
| ·状态模型描述 | 第14-17页 |
| ·所有状态模型及其解的概述 | 第14-15页 |
| ·马尔可夫决策过程 | 第15-16页 |
| ·Race Track问题(跑道问题) | 第16-17页 |
| ·本文工作 | 第17-19页 |
| 第二章 不确定性智能规划的典型算法 | 第19-35页 |
| ·值迭代算法和策略迭代算法 | 第19-20页 |
| ·值迭代算法 | 第19-20页 |
| ·策略迭代算法 | 第20页 |
| ·RTDP算法和LRTDP算法 | 第20-26页 |
| ·实时DP算法 | 第21-22页 |
| ·Trial-Based RTDP 算法 | 第22-24页 |
| ·LRTDP算法 | 第24-26页 |
| ·一般性启发式算法 | 第26-32页 |
| ·一般性启发式算法框架 Find-and-Revise | 第26-28页 |
| ·算法 HDP | 第28-30页 |
| ·算法LDFS | 第30-32页 |
| ·带循环的AO*算法 LAO*算法 | 第32-33页 |
| ·算法分析 | 第33-35页 |
| 第三章 经典算法RTDP收敛性的改进 | 第35-47页 |
| ·从LRTA*算法到LRTA*(k)算法 | 第35-38页 |
| ·LRTA*算法是RTDP算法的非概率版本 | 第35-36页 |
| ·LRTA*(k)算法 | 第36-38页 |
| ·RTDP收敛性的改进算法RTDP(k) | 第38-47页 |
| ·启发值改变的传播策略 | 第39-41页 |
| ·RTDP(k)算法 | 第41-45页 |
| ·实验结果 | 第45-47页 |
| 第四章 鲁棒性不确定性智能规划 | 第47-60页 |
| ·最好模型和最坏模型 | 第48-51页 |
| ·不确定马尔可夫模型 | 第48-49页 |
| ·最好模型和最坏模型 | 第49-51页 |
| ·鲁棒性HDP算法(rHDP) | 第51-56页 |
| ·算法 | 第51-54页 |
| ·实验结果 | 第54-56页 |
| ·鲁棒性LAO*算法(rLAO*) | 第56-60页 |
| ·算法 | 第56-58页 |
| ·实验结果 | 第58-60页 |
| 第五章 总结与展望 | 第60-61页 |
| 参考文献 | 第61-64页 |
| 摘要 | 第64-67页 |
| Abstract | 第67-70页 |
| 致谢 | 第70-71页 |
| 导师及作者简介 | 第71页 |