摘要 | 第4-6页 |
Abstract | 第6-7页 |
目录 | 第8-10页 |
Contents | 第10-12页 |
第一章 引言 | 第12-17页 |
1.1 研究背景 | 第12-13页 |
1.2 研究现状 | 第13-15页 |
1.3 本文结构 | 第15-17页 |
第二章 预测状态表示方法 | 第17-38页 |
2.1 引言 | 第17页 |
2.2 预测状态表示方法介绍 | 第17-21页 |
2.2.1 预备知识 | 第17-20页 |
2.2.2 系统的PSR模型 | 第20-21页 |
2.3 系统动态矩阵 | 第21-24页 |
2.4 从系统动态矩阵学习系统的PSR模型 | 第24-29页 |
2.5 由系统的POMDP模型获取系统的PSR模型 | 第29-36页 |
2.5.1 POMDP模型介绍 | 第29-33页 |
2.5.2 从POMDP模型到PSR模型的转换 | 第33-36页 |
2.6 PSR模型和POMDP模型的表征能力比较 | 第36-37页 |
2.7 小结 | 第37-38页 |
第三章 基于状态空间划分获取和学习系统整体的PSR模型 | 第38-62页 |
3.1 引言 | 第38页 |
3.2 状态空间划分方法 | 第38-40页 |
3.2.1 landmark的性质 | 第38-39页 |
3.2.2 状态空间的划分方法 | 第39-40页 |
3.3 获取当前子状态空间的PSR模型 | 第40-49页 |
3.3.1 获取当前子状态空间的经历集合 | 第41-43页 |
3.3.2 获取当前子状态空间的动态子矩阵 | 第43-44页 |
3.3.3 发现当前子状态空间的检验核 | 第44-47页 |
3.3.4 获取当前子状态空间的PSR模型参数 | 第47-49页 |
3.4 获取基于状态空间划分的系统整体的PSR模型 | 第49-51页 |
3.5 实验 | 第51-61页 |
3.6 小结 | 第61-62页 |
第四章 基于状态空间划分获取和学习系统整体的TPSR模型 | 第62-80页 |
4.1 引言 | 第62页 |
4.2 转移预测状态表示介绍 | 第62-63页 |
4.3 获取当前子状态空间的TPSR模型 | 第63-68页 |
4.3.1 获取当前子状态空间的系统动态子矩阵 | 第64-65页 |
4.3.2 学习当前子状态空间的TPSR模型参数 | 第65-68页 |
4.4 基于状态空间划分获取系统整体的TPSR模型 | 第68-69页 |
4.5 实验 | 第69-79页 |
4.6 小结 | 第79-80页 |
第五章 总结与展望 | 第80-82页 |
5.1 总结 | 第80页 |
5.2 展望 | 第80-82页 |
参考文献 | 第82-87页 |
攻读硕士期间所发表论文与参与项目 | 第87-88页 |
致谢 | 第88页 |