摘要 | 第1-5页 |
Abstract | 第5-16页 |
1.绪论 | 第16-19页 |
·动态不确定性环境 | 第16-18页 |
·本文主要内容 | 第18-19页 |
2.现有主要规划系统 | 第19-39页 |
·经典规划系统(Classical Planning) | 第19-26页 |
·基于情形演算(Situation Calculus)的规划系统 | 第19-22页 |
·情形演算概述 | 第19-21页 |
·框架问题(frame problem) | 第21页 |
·GOLOG | 第21-22页 |
·STRIPS | 第22-23页 |
·GraphPlan | 第23-24页 |
·SATPlan | 第24页 |
·偏序规划(Partial-Order Planning) | 第24-26页 |
·经典规划适应动态不确定性环境的问题 | 第26页 |
·分层规划系统 | 第26-27页 |
·HTN(Hierarchical Task-Network Planning)规划 | 第26-27页 |
·分层规划系统适应动态不确定性环境的问题 | 第27页 |
·持续规划系统 | 第27-30页 |
·PRS(Procedural Reasoning System) | 第28-29页 |
·PRS的特点及对动态不确定性环境的适应 | 第29-30页 |
·基于决策论的规划 | 第30-39页 |
·与经典规划结合的决策论规划 | 第30-31页 |
·DDNs(Dynamic Decision Networks) | 第31-34页 |
·MDP(Markov Decision Process) | 第34-36页 |
·POMDP(Partially Observable Markov Decision Process) | 第36-37页 |
·基于决策论的规划对动态不确定性环境的适应 | 第37-39页 |
3.POMDPRS | 第39-70页 |
·对于环境的基本认识 | 第39-40页 |
·POMDPRS的基本原理 | 第40-47页 |
·POMDPRS基本模型 | 第40-41页 |
·POMDPRS的系统结构 | 第41-43页 |
·POMDPRS系统运行原理 | 第43-47页 |
·信念更新 | 第43-44页 |
·可执行相关计划及回报评估 | 第44-46页 |
·系统运行的基本框架 | 第46-47页 |
·POMDPRS的形式化描述 | 第47-62页 |
·内涵语言定义 | 第47-51页 |
·描述语言 | 第47-48页 |
·状态 | 第48页 |
·观察 | 第48-49页 |
·原子动作 | 第49页 |
·目标 | 第49页 |
·信念 | 第49页 |
·计划 | 第49-51页 |
·意图 | 第51页 |
·操作语义 | 第51-62页 |
·Agent和Agent状态的定义 | 第52-53页 |
·信念更新 | 第53-55页 |
·获得新事件的处理 | 第55-57页 |
·回报评估 | 第57页 |
·对事件的响应 | 第57-60页 |
·意图的执行 | 第60-62页 |
·解释器的操作循环 | 第62页 |
·POMDPRS性能分析 | 第62-70页 |
·对环境动态性的适应 | 第63页 |
·对环境不确定性的适应 | 第63-64页 |
·实时性 | 第64-65页 |
·实例分析 | 第65-70页 |
4.POMDPRS的因子化——FPOMDPRS | 第70-80页 |
·FHMM | 第70-71页 |
·POMDPRS的状态因子化模型 | 第71-73页 |
·FPOMDPRS的形式化描述 | 第73-78页 |
·基本元素 | 第73-74页 |
·操作语义 | 第74-78页 |
·信念的更新 | 第74-77页 |
·对事件的响应 | 第77页 |
·意图的执行 | 第77-78页 |
·FPOMDPRS的系统性能分析 | 第78-80页 |
5.Monte Carlo滤波在POMDPRS的应用——MCPOMDPRS | 第80-89页 |
·Monte Carlo滤波简介 | 第80-81页 |
·MCPOMDPRS(Monte Carlo POMDPRS) | 第81-88页 |
·MCPOMDPRS的形式化描述 | 第81-85页 |
·MCPOMDPRS的实时性能分析 | 第85-86页 |
·MCPOMDPRS的一些问题 | 第86-88页 |
·FPOMDPRS与MCPOMDPRS的结合应用 | 第88-89页 |
6.基于RoboCup四腿机器人平台的实验系统 | 第89-115页 |
·RoboCup四腿机器人足球简介 | 第89-92页 |
·基于POMDPRS的足球四腿机器人控制系统 | 第92-93页 |
·P-DOG的底层控制 | 第93-94页 |
·基于POMDPRS的高层控制 | 第94-105页 |
·信念及其处理复杂度的降低 | 第94-98页 |
·定位模块 | 第98-102页 |
·决策模块 | 第102-105页 |
·实验结果 | 第105-115页 |
·对动态不确定性环境的适应 | 第105-112页 |
·实时性性能 | 第112-115页 |
7.结论与展望 | 第115-118页 |
参考文献 | 第118-126页 |
作者发表的与本文相关论文 | 第126页 |