首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机械手论文

基于深度强化学习的机械臂卷积神经网络控制策略研究

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-19页
    1.1 课题研究的背景和意义第9-10页
    1.2 国内外研究现状与分析第10-18页
        1.2.1 家庭服务机器人研究现状与分析第10-11页
        1.2.2 深度强化学习研究现状第11-14页
        1.2.3 机械臂深度强化学习控制方法研究现状第14-17页
        1.2.4 文献综述分析第17-18页
    1.3 主要研究内容第18-19页
第2章 基于策略搜索的强化学习机械臂控制器生成与优化方法研究第19-40页
    2.1 引言第19页
    2.2 深度强化学习算法结构流程第19-22页
        2.2.1 深度强化学习算法问题分解第19-21页
        2.2.2 深度强化学习算法流程第21-22页
    2.3 基于策略搜索的机械臂控制器生成与优化第22-32页
        2.3.1 策略搜索代价函数建立第22-23页
        2.3.2 局部环境动态模型拟合第23-27页
        2.3.3 机械臂控制器生成与优化第27-30页
        2.3.4 机械臂控制器初始参数整定第30-32页
    2.4 策略搜索算法仿真研究第32-38页
        2.4.1 策略搜索算法仿真验证第32-34页
        2.4.2 基于策略搜索的机械臂物品放置任务仿真第34-38页
    2.5 本章小结第38-40页
第3章 机械臂卷积神经网络控制策略研究第40-58页
    3.1 引言第40页
    3.2 机械臂卷积神经网络控制策略建立第40-41页
    3.3 卷积神经网络结构设计第41-43页
        3.3.1 卷积神经网络总体结构第41-42页
        3.3.2 卷积神经网络视觉层设计第42-43页
    3.4 卷积神经网络训练设置与训练方法第43-50页
        3.4.1 卷积神经网络损失函数设置第43-44页
        3.4.2 卷积神经网络训练采样方法设置第44-45页
        3.4.3 卷积神经网络训练初始化设置第45-47页
        3.4.4 卷积神经网络训练方法第47-50页
    3.5 卷积神经网络策略仿真研究第50-57页
        3.5.1 卷积神经网络视觉层仿真验证第50-52页
        3.5.2 卷积神经网络训练采样方法仿真第52-53页
        3.5.3 卷积神经网络预训练方法仿真第53-55页
        3.5.4 机械臂卷积神经网络控制策略仿真第55-57页
    3.6 本章小结第57-58页
第4章 机械臂深度强化学习实验研究第58-69页
    4.1 引言第58页
    4.2 实验平台搭建与控制系统建立第58-60页
        4.2.1 机械臂实验平台搭建第58-59页
        4.2.2 机械臂控制系统建立第59-60页
    4.3 策略搜索算法实验研究第60-64页
        4.3.1 不同种类物品放置实验研究第60-61页
        4.3.2 不同位置物品放置实验研究第61-63页
        4.3.3 不同姿态物品放置实验研究第63-64页
    4.4 机械臂卷积神经网络控制策略实验研究第64-68页
        4.4.1 卷积神经网络策略实验环境第64-65页
        4.4.2 卷积神经网络策略实验研究第65-68页
    4.5 本章小结第68-69页
结论第69-70页
参考文献第70-76页
附录第76-81页
攻读学位期间发表的学术论文及其它成果第81-83页
致谢第83页

论文共83页,点击 下载论文
上一篇:基于深度卷积网络的知识图谱补全模型
下一篇:一种数字化舵机控制系统的设计