首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

分层强化学习与潜在动作模型的研究与应用

摘要第5-6页
Abstract第6-7页
第一章 引言第10-14页
    1.1 机器人发展史简介第10页
    1.2 自主心智发育思想第10-11页
    1.3 潜在动作第11-12页
    1.4 主要研究工作以及内容安排第12-14页
第二章 潜在动作模型理论第14-23页
    2.1 潜在动作模型的介绍第14-15页
    2.2 潜在动作的意义第15-16页
    2.3 潜在动作的研究现状第16-20页
        2.3.1 贝叶斯潜在动作模型第17-18页
        2.3.2 三元组潜在动作模型第18-19页
        2.3.3 层次化潜在动作模型第19-20页
    2.4 基于能量的潜在动作模型第20-21页
    2.5 本章小结第21-23页
第三章 分层强化学习第23-37页
    3.1 分层强化学习国内外研究现状第23-25页
    3.2 马尔可夫与半马尔可夫决策过程第25-26页
    3.3 值函数分解第26-29页
    3.4 状态抽象第29-30页
    3.5 基于能量的潜在动作模型分层强化学习算法第30-34页
    3.6 学习参数第34-36页
        3.6.1 学习因子第35页
        3.6.2 策略第35-36页
        3.6.3 折扣因子第36页
    3.7 本章小结第36-37页
第四章 分层强化学习与潜在动作模型的应用第37-61页
    4.1 虚拟障碍物环境下机器人路径规划应用第38-48页
        4.1.1 场景描述第38-39页
        4.1.2 任务图与值函数图的构建第39-40页
        4.1.3 状态抽象计算第40-42页
        4.1.4 初始路径规划第42-44页
        4.1.5 障碍物的潜在动作模型第44-48页
    4.2 复杂障碍物环境下机器人路径规划应用第48-56页
        4.2.1 实验场景描述第50-51页
        4.2.2 学习因子分析第51-53页
        4.2.3 状态抽象分析第53-54页
        4.2.4 基于能量的潜在动作模型第54-55页
        4.2.5 实验结果分析第55-56页
    4.3 基于能量的潜在动作模型在两机器人的应用第56-60页
        4.3.1 实验场景描述第57-58页
        4.3.2 两机器人的能量潜在动作模型第58页
        4.3.3 实验结果分析第58-60页
    4.4 本章小结第60-61页
总结与展望第61-62页
参考文献第62-66页
攻读硕士学位期间取得的研究成果第66-67页
致谢第67-68页
附件第68页

论文共68页,点击 下载论文
上一篇:基于BP神经网络的情感机器人玩具的设计与实现
下一篇:模块化主从遥操作控制系统的实现及可操作性研究