基于深度强化学习的机械臂卷积神经网络控制策略研究

摘要	第4-5页
Abstract	第5-6页
第1章绪论	第9-19页
1.1 课题研究的背景和意义	第9-10页
1.2 国内外研究现状与分析	第10-18页
1.2.1 家庭服务机器人研究现状与分析	第10-11页
1.2.2 深度强化学习研究现状	第11-14页
1.2.3 机械臂深度强化学习控制方法研究现状	第14-17页
1.2.4 文献综述分析	第17-18页
1.3 主要研究内容	第18-19页
第2章基于策略搜索的强化学习机械臂控制器生成与优化方法研究	第19-40页
2.1 引言	第19页
2.2 深度强化学习算法结构流程	第19-22页
2.2.1 深度强化学习算法问题分解	第19-21页
2.2.2 深度强化学习算法流程	第21-22页
2.3 基于策略搜索的机械臂控制器生成与优化	第22-32页
2.3.1 策略搜索代价函数建立	第22-23页
2.3.2 局部环境动态模型拟合	第23-27页
2.3.3 机械臂控制器生成与优化	第27-30页
2.3.4 机械臂控制器初始参数整定	第30-32页
2.4 策略搜索算法仿真研究	第32-38页
2.4.1 策略搜索算法仿真验证	第32-34页
2.4.2 基于策略搜索的机械臂物品放置任务仿真	第34-38页
2.5 本章小结	第38-40页
第3章机械臂卷积神经网络控制策略研究	第40-58页
3.1 引言	第40页
3.2 机械臂卷积神经网络控制策略建立	第40-41页
3.3 卷积神经网络结构设计	第41-43页
3.3.1 卷积神经网络总体结构	第41-42页
3.3.2 卷积神经网络视觉层设计	第42-43页
3.4 卷积神经网络训练设置与训练方法	第43-50页
3.4.1 卷积神经网络损失函数设置	第43-44页
3.4.2 卷积神经网络训练采样方法设置	第44-45页
3.4.3 卷积神经网络训练初始化设置	第45-47页
3.4.4 卷积神经网络训练方法	第47-50页
3.5 卷积神经网络策略仿真研究	第50-57页
3.5.1 卷积神经网络视觉层仿真验证	第50-52页
3.5.2 卷积神经网络训练采样方法仿真	第52-53页
3.5.3 卷积神经网络预训练方法仿真	第53-55页
3.5.4 机械臂卷积神经网络控制策略仿真	第55-57页
3.6 本章小结	第57-58页
第4章机械臂深度强化学习实验研究	第58-69页
4.1 引言	第58页
4.2 实验平台搭建与控制系统建立	第58-60页
4.2.1 机械臂实验平台搭建	第58-59页
4.2.2 机械臂控制系统建立	第59-60页
4.3 策略搜索算法实验研究	第60-64页
4.3.1 不同种类物品放置实验研究	第60-61页
4.3.2 不同位置物品放置实验研究	第61-63页
4.3.3 不同姿态物品放置实验研究	第63-64页
4.4 机械臂卷积神经网络控制策略实验研究	第64-68页
4.4.1 卷积神经网络策略实验环境	第64-65页
4.4.2 卷积神经网络策略实验研究	第65-68页
4.5 本章小结	第68-69页
结论	第69-70页
参考文献	第70-76页
附录	第76-81页
攻读学位期间发表的学术论文及其它成果	第81-83页
致谢	第83页