首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于马尔科夫理论的不确定性规划和感知问题研究

摘要第5-7页
ABSTRACT第7-8页
目录第9-12页
表格索引第12-13页
插图索引第13-14页
算法索引第14-15页
主要符号对照表第15-16页
第一章 绪论第16-26页
    内容提要第16页
    1.1 引言第16-20页
    1.2 马尔科夫模型第20-24页
    1.3 论文的内容与组织结构第24-26页
第二章 马尔科夫决策理论第26-50页
    内容提要第26页
    2.1 马尔科夫决策过程基本模型第26-31页
    2.2 马尔科夫决策过程求解算法第31-38页
        2.2.1 离线求解算法第31-33页
        2.2.2 在线求解算法第33-38页
    2.3 马尔科夫决策过程分层分解第38-41页
        2.3.1 半马尔科夫决策过程第39页
        2.3.2 MAXQ分层分解第39-41页
    2.4 部分可观察马尔科夫决策过程基本模型第41-42页
    2.5 部分可观察马尔科夫决策过程求解算法第42-48页
        2.5.1 离线求解算法第43-45页
        2.5.2 在线求解算法第45-48页
    2.6 本章小结第48-50页
第三章 基于MAXQ分层分解的在线规划算法第50-72页
    内容提要第50页
    3.1 基本介绍第50-52页
    3.2 相关工作第52-53页
    3.3 基于MAXQ分层分解的在线规划第53-58页
        3.3.1 MAXQ-OP算法简介第54-56页
        3.3.2 MAXQ-OP算法的主要流程第56页
        3.3.3 分层任务评估第56-57页
        3.3.4 完成函数近似计算第57页
        3.3.5 动作空间中的启发式搜索第57-58页
    3.4 标准测试:出租车问题第58-60页
    3.5 案例研究:RoboCup仿真2D机器人足球第60-71页
        3.5.1 RoboCup仿真2D机器人足球简介第61-62页
        3.5.2 RoboCup仿真2D机器人足球建模成MDP第62-63页
        3.5.3 状态估计第63-64页
        3.5.4 MAXQ-OP解决方案第64-68页
        3.5.5 实验评估第68-71页
    3.6 本章小结第71-72页
第四章 基于后验动作采样的蒙特卡洛在线规划算法第72-96页
    内容提要第72页
    4.1 基本介绍第72-74页
    4.2 相关工作第74-75页
    4.3 基于后验动作采样的MDP蒙特卡洛规划第75-80页
        4.3.1 基本假设第75-76页
        4.3.2 贝叶斯建模和推理第76-77页
        4.3.3 基于Thompson采样的动作选择策略第77-79页
        4.3.4 DNG-MCTS算法第79-80页
    4.4 基于后验动作采样的POMDP蒙特卡洛规划第80-85页
        4.4.1 基本假设第80-81页
        4.4.2 贝叶斯建模和推理第81-82页
        4.4.3 基于Thompson采样的动作选择策略第82页
        4.4.4 D2NG-POMCP算法第82-85页
    4.5 讨论第85-86页
        4.5.1 先验分布第85-86页
        4.5.2 收敛性质第86页
    4.6 实验结果第86-94页
        4.6.1 研究动机验证实验第87-88页
        4.6.2 MDP实验第88-91页
        4.6.3 POMDP实验第91-94页
        4.6.4 计算复杂度讨论第94页
    4.7 本章小结第94-96页
第五章 基于集合粒子滤波的多对象跟踪算法第96-116页
    内容提要第96页
    5.1 基本介绍第96-97页
    5.2 相关工作第97-98页
    5.3 集合粒子滤波方法第98-105页
        5.3.1 将集合看成一个随机变量第98-99页
        5.3.2 隐马尔科夫模型形式化第99-100页
        5.3.3 观察函数近似第100-101页
        5.3.4 粒子滤波第101-104页
        5.3.5 个体确认算法第104-105页
    5.4 实验验证第105-113页
        5.4.1 近似误差测试实验第107-108页
        5.4.2 标准测试数据集实验第108-111页
        5.4.3 真实机器人演示第111-113页
    5.5 本章小结第113-116页
第六章 总结和展望第116-122页
    6.1 工作总结第116-119页
    6.2 前景展望第119-122页
参考文献第122-130页
致谢第130-132页
在读期间发表的学术论文与取得的研究成果第132-135页

论文共135页,点击 下载论文
上一篇:子公司管理者议题营销行为有效性研究:注意力基础观的视角
下一篇:关于用户强迫性使用社交网站的行为研究--非认知性模型分析