摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
目录 | 第9-12页 |
表格索引 | 第12-13页 |
插图索引 | 第13-14页 |
算法索引 | 第14-15页 |
主要符号对照表 | 第15-16页 |
第一章 绪论 | 第16-26页 |
内容提要 | 第16页 |
1.1 引言 | 第16-20页 |
1.2 马尔科夫模型 | 第20-24页 |
1.3 论文的内容与组织结构 | 第24-26页 |
第二章 马尔科夫决策理论 | 第26-50页 |
内容提要 | 第26页 |
2.1 马尔科夫决策过程基本模型 | 第26-31页 |
2.2 马尔科夫决策过程求解算法 | 第31-38页 |
2.2.1 离线求解算法 | 第31-33页 |
2.2.2 在线求解算法 | 第33-38页 |
2.3 马尔科夫决策过程分层分解 | 第38-41页 |
2.3.1 半马尔科夫决策过程 | 第39页 |
2.3.2 MAXQ分层分解 | 第39-41页 |
2.4 部分可观察马尔科夫决策过程基本模型 | 第41-42页 |
2.5 部分可观察马尔科夫决策过程求解算法 | 第42-48页 |
2.5.1 离线求解算法 | 第43-45页 |
2.5.2 在线求解算法 | 第45-48页 |
2.6 本章小结 | 第48-50页 |
第三章 基于MAXQ分层分解的在线规划算法 | 第50-72页 |
内容提要 | 第50页 |
3.1 基本介绍 | 第50-52页 |
3.2 相关工作 | 第52-53页 |
3.3 基于MAXQ分层分解的在线规划 | 第53-58页 |
3.3.1 MAXQ-OP算法简介 | 第54-56页 |
3.3.2 MAXQ-OP算法的主要流程 | 第56页 |
3.3.3 分层任务评估 | 第56-57页 |
3.3.4 完成函数近似计算 | 第57页 |
3.3.5 动作空间中的启发式搜索 | 第57-58页 |
3.4 标准测试:出租车问题 | 第58-60页 |
3.5 案例研究:RoboCup仿真2D机器人足球 | 第60-71页 |
3.5.1 RoboCup仿真2D机器人足球简介 | 第61-62页 |
3.5.2 RoboCup仿真2D机器人足球建模成MDP | 第62-63页 |
3.5.3 状态估计 | 第63-64页 |
3.5.4 MAXQ-OP解决方案 | 第64-68页 |
3.5.5 实验评估 | 第68-71页 |
3.6 本章小结 | 第71-72页 |
第四章 基于后验动作采样的蒙特卡洛在线规划算法 | 第72-96页 |
内容提要 | 第72页 |
4.1 基本介绍 | 第72-74页 |
4.2 相关工作 | 第74-75页 |
4.3 基于后验动作采样的MDP蒙特卡洛规划 | 第75-80页 |
4.3.1 基本假设 | 第75-76页 |
4.3.2 贝叶斯建模和推理 | 第76-77页 |
4.3.3 基于Thompson采样的动作选择策略 | 第77-79页 |
4.3.4 DNG-MCTS算法 | 第79-80页 |
4.4 基于后验动作采样的POMDP蒙特卡洛规划 | 第80-85页 |
4.4.1 基本假设 | 第80-81页 |
4.4.2 贝叶斯建模和推理 | 第81-82页 |
4.4.3 基于Thompson采样的动作选择策略 | 第82页 |
4.4.4 D2NG-POMCP算法 | 第82-85页 |
4.5 讨论 | 第85-86页 |
4.5.1 先验分布 | 第85-86页 |
4.5.2 收敛性质 | 第86页 |
4.6 实验结果 | 第86-94页 |
4.6.1 研究动机验证实验 | 第87-88页 |
4.6.2 MDP实验 | 第88-91页 |
4.6.3 POMDP实验 | 第91-94页 |
4.6.4 计算复杂度讨论 | 第94页 |
4.7 本章小结 | 第94-96页 |
第五章 基于集合粒子滤波的多对象跟踪算法 | 第96-116页 |
内容提要 | 第96页 |
5.1 基本介绍 | 第96-97页 |
5.2 相关工作 | 第97-98页 |
5.3 集合粒子滤波方法 | 第98-105页 |
5.3.1 将集合看成一个随机变量 | 第98-99页 |
5.3.2 隐马尔科夫模型形式化 | 第99-100页 |
5.3.3 观察函数近似 | 第100-101页 |
5.3.4 粒子滤波 | 第101-104页 |
5.3.5 个体确认算法 | 第104-105页 |
5.4 实验验证 | 第105-113页 |
5.4.1 近似误差测试实验 | 第107-108页 |
5.4.2 标准测试数据集实验 | 第108-111页 |
5.4.3 真实机器人演示 | 第111-113页 |
5.5 本章小结 | 第113-116页 |
第六章 总结和展望 | 第116-122页 |
6.1 工作总结 | 第116-119页 |
6.2 前景展望 | 第119-122页 |
参考文献 | 第122-130页 |
致谢 | 第130-132页 |
在读期间发表的学术论文与取得的研究成果 | 第132-135页 |