| 中文摘要 | 第3-4页 |
| 英文摘要 | 第4-5页 |
| 1 绪论 | 第8-18页 |
| 1.1 问题的提出 | 第8-11页 |
| 1.2 课题的背景及意义 | 第11-13页 |
| 1.3 国内外研究现状 | 第13-16页 |
| 1.3.1 无标定视觉伺服研究现状 | 第13-15页 |
| 1.3.2 强化学习在机器人控制中的应用研究现状 | 第15-16页 |
| 1.4 本文研究内容和结构 | 第16-18页 |
| 2 机械手无标定视觉伺服系统模型和控制方法分析 | 第18-32页 |
| 2.1 机械手无标定视觉伺服建模 | 第18-27页 |
| 2.1.1 摄像机模型 | 第19-22页 |
| 2.1.2 机械手运动学模型 | 第22-25页 |
| 2.1.3 雅克比矩阵模型 | 第25-27页 |
| 2.2 无标定视觉伺服控制方法 | 第27-30页 |
| 2.2.1 摄像机视觉系统构建 | 第27-29页 |
| 2.2.2 图像特征提取规则 | 第29页 |
| 2.2.3 无标定视觉伺服控制器设计 | 第29-30页 |
| 2.3 本章小结 | 第30-32页 |
| 3 基于强化学习的机械手无标定视觉伺服控制策略 | 第32-54页 |
| 3.1 基于强化学习的无标定视觉伺服控制任务 | 第32-33页 |
| 3.2 强化学习理论 | 第33-38页 |
| 3.2.1 强化学习基本要素 | 第33-34页 |
| 3.2.2 强化学习研究方法 | 第34-36页 |
| 3.2.3 时序差分学习算法 | 第36-38页 |
| 3.3 基于强化学习的无标定视觉伺服控制方法 | 第38-44页 |
| 3.3.1 基于强化学习的无标定视觉伺服控制算法 | 第39-40页 |
| 3.3.2 图像特征提取方法 | 第40-42页 |
| 3.3.3 图像雅克比矩阵的在线卡尔曼滤波估计 | 第42-44页 |
| 3.4 基于强化学习的无标定视觉伺服仿真实验 | 第44-52页 |
| 3.4.1 仿真环境建模 | 第44-45页 |
| 3.4.2 基于强化学习的无标定视觉伺服控制仿真 | 第45-46页 |
| 3.4.3 仿真结果及分析 | 第46-52页 |
| 3.5 本章小结 | 第52-54页 |
| 4 基于强化学习的无标定视觉伺服控制实验 | 第54-70页 |
| 4.1 基于强化学习机械手无标定视觉伺服系统总体构成 | 第54-55页 |
| 4.2 基于强化学习的机械手无标定视觉伺服硬件系统 | 第55-58页 |
| 4.2.1 Denso机械手硬件系统构成 | 第55-58页 |
| 4.2.2 双目视觉硬件系统构成 | 第58页 |
| 4.3 基于强化学习的机械手无标定视觉伺服软件系统 | 第58-63页 |
| 4.3.1 Denso机械手控制软件 | 第59-61页 |
| 4.3.2 图像处理与特征提取 | 第61-63页 |
| 4.4 基于强化学习的机械手无标定视觉伺服控制实验 | 第63-69页 |
| 4.4.1 机械手控制方案设计 | 第64-65页 |
| 4.4.2 机械手控制实验及结果分析 | 第65-69页 |
| 4.5 本章小结 | 第69-70页 |
| 5 总结与展望 | 第70-72页 |
| 致谢 | 第72-74页 |
| 参考文献 | 第74-80页 |
| 附录 | 第80页 |
| A 作者在攻读硕士学位期间发表的论文目录 | 第80页 |
| B 作者在攻读硕士学位期间申请的专利目录 | 第80页 |
| C 作者在攻读硕士学位期间获得的奖励目录 | 第80页 |