摘要 | 第1-6页 |
Abstract | 第6-10页 |
第1章 绪论 | 第10-18页 |
·引言 | 第10页 |
·机器人导航智能控制算法 | 第10-13页 |
·POMDP算法的国内外研究现状 | 第13-15页 |
·本课题的研究意义 | 第15-16页 |
·论文的主要工作和组织 | 第16-18页 |
第2章 POMDP基本理论 | 第18-39页 |
·Markov决策过程的起源与发展 | 第18页 |
·Markov决策过程的定义 | 第18-20页 |
·MDP问题的求解 | 第20-23页 |
·从MDP到POMDP | 第23-24页 |
·POMDP的定义 | 第24-28页 |
·POMDP模型的定义 | 第24-25页 |
·信度状态,策略和值函数 | 第25-28页 |
·POMDP问题的求解 | 第28-34页 |
·POMDP的值函数 | 第28-29页 |
·POMDP问题的决策树及值迭代算法 | 第29-31页 |
·值函数的简化 | 第31-34页 |
·POMDP求解实例 | 第34-38页 |
·本章小结 | 第38-39页 |
第3章 POMDP算法研究 | 第39-51页 |
·求解POMDP的代表性算法 | 第39-40页 |
·值迭代 | 第39-40页 |
·策略迭代 | 第40页 |
·POMDP的理论结果 | 第40-41页 |
·POMDP值迭代精确求解算法 | 第41-45页 |
·值函数的分解 | 第41-43页 |
·值迭代超集算法 | 第43-45页 |
·对值迭代算法的改进 | 第45-50页 |
·算法的改进 | 第45-47页 |
·改进算法的实验分析 | 第47-50页 |
·本章小结 | 第50-51页 |
第4章 基于POMDP的机器人导航方法研究 | 第51-64页 |
·基于POMDP模型实现机器人导航系统的各要素设计 | 第51-53页 |
·状态空间和动作空间的表示 | 第51-52页 |
·奖赏值的设计 | 第52-53页 |
·环境信息的获取 | 第53-60页 |
·声纳传感器模型 | 第54-55页 |
·使用声纳传感器更新栅格状态 | 第55-60页 |
·导航的任务设置 | 第60页 |
·路径规划 | 第60页 |
·环境建模 | 第60页 |
·导航策略 | 第60-63页 |
·路径规划策略设计 | 第60-62页 |
·环境建模策略设计 | 第62-63页 |
·本章小结 | 第63-64页 |
第5章 仿真设计及结果分析 | 第64-71页 |
·仿真系统设计 | 第64-65页 |
·路径规划仿真分析 | 第65-69页 |
·避障成功的仿真结果 | 第65-66页 |
·对极点问题的解决 | 第66-69页 |
·环境建模仿真分析 | 第69-70页 |
·本章小结 | 第70-71页 |
结论 | 第71-73页 |
参考文献 | 第73-77页 |
攻读硕士期间发表的论文和取得的科研成果 | 第77-78页 |
致谢 | 第78页 |