首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机械手论文

基于DQN的机械臂控制策略的研究

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 绪论第12-18页
    1.1 研究背景及意义第12-13页
    1.2 国内外研究现状第13-16页
        1.2.1 机器人控制策略第13-15页
        1.2.2 深度学习第15页
        1.2.3 强化学习第15-16页
    1.3 研究内容第16页
    1.4 论文组织结构第16-18页
2 相关理论基础第18-29页
    2.1 深度学习第18-24页
        2.1.1 深度学习基本思想第18页
        2.1.2 人工神经网络第18-23页
        2.1.3 卷积神经网络第23-24页
    2.2 强化学习第24-28页
        2.2.1 强化学习简介第24-25页
        2.2.2 强化学习数学模型第25-26页
        2.2.3 策略迭代与值迭代第26-27页
        2.2.4 Q-learning算法第27-28页
    2.3 本章小结第28-29页
3 基于引导式DQN的机械臂控制策略第29-45页
    3.1 机械臂控制策略的马尔可夫建模第29-34页
        3.1.1 机械臂感知环境模型第29-30页
        3.1.2 机械臂动作空间第30-31页
        3.1.3 数据增强第31-33页
        3.1.4 系统状态模型第33-34页
        3.1.5 基于机械臂控制策略的回报函数设计第34页
    3.2 DQN策略控制第34-39页
        3.2.1 机械臂策略网络第35-37页
        3.2.2 策略网络优化模型第37-39页
    3.3 基于引导式DQN的算法设计第39-43页
        3.3.1 网络结构第39-41页
        3.3.2 采样算法第41-42页
        3.3.3 深层探索策略第42-43页
    3.4 本章小结第43-45页
4 基于递归式DQN的机械臂控制策略第45-57页
    4.1 部分可观测马尔科夫决策过程第45-48页
        4.1.1 部分可观测机械臂环境建模第46-48页
    4.2 基于递归式DQN的算法设计第48-52页
        4.2.1 递归神经网络模型第48-51页
        4.2.2 基于LSTM的隐含信息建模第51-52页
    4.3 机械臂安全保障机制第52-56页
        4.3.1 机械臂关节坐标第52-54页
        4.3.2 与外框支架的碰撞第54-55页
        4.3.3 与自身的碰撞第55-56页
    4.4 本章小结第56-57页
5 真实场景下的实验及结果分析第57-68页
    5.1 真实场景系统第57-58页
        5.1.1 机械臂平台介绍第57-58页
        5.1.2 其他软硬件环境第58页
    5.2 实验的设计与实现第58-59页
        5.2.1 实验的模型实现第58-59页
        5.2.2 评价标准设计第59页
    5.3 实验结果分析第59-67页
        5.3.1 各算法比较第59-67页
    5.4 本章小结第67-68页
6 总结和展望第68-70页
    6.1 总结第68页
    6.2 展望第68-70页
参考文献第70-74页
作者简历及攻读硕士学位期间取得的研究成果第74-76页
学位论文数据集第76页

论文共76页,点击 下载论文
上一篇:基于快速控制原型的6-DOF机械臂轨迹跟踪无模型自适应控制
下一篇:QCM传感器气体检测系统设计及其在鸡蛋品质检测中的应用