首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于Q学习算法的机械臂轨迹规划研究

摘要第1-5页
ABSTRACT第5-7页
创新点摘要第7-10页
第一章 绪论第10-15页
   ·课题的来源、目的及研究意义第10-11页
   ·国内外研究现状第11-14页
     ·机器人分类第11页
     ·机械臂的控制第11-12页
     ·强化学习研究现状第12-14页
   ·本文的主要工作第14-15页
第二章 机械臂控制系统分析第15-23页
   ·机械臂结构分析第15-17页
   ·机械臂的坐标变换第17-20页
   ·机械臂控制参量的选择第20-22页
   ·本章小结第22-23页
第三章 改进 Q 学习控制算法第23-37页
   ·马尔可夫环境下的 Q 学习算法第23-25页
   ·Q 算法学习在机器人路径寻优中的应用第25-30页
   ·多智能体的状态相关性第30-32页
   ·改进算法的收敛性证明第32-35页
   ·状态耦合 Q 算法的泛化能力分析第35-36页
   ·本章小结第36-37页
第四章 控制器策略改进第37-48页
   ·机械臂轨迹规划控制器设计第37-38页
   ·控制器中状态感知器设计第38页
   ·基于动态贪婪策略的动作选择器第38-43页
     ·ε-greedy 算法第39-40页
     ·模拟退火算法第40-41页
     ·动态贪婪策略第41-43页
   ·评价措施及其定量评价单元第43-45页
   ·学习经验在线更新机构第45-47页
   ·本章小结第47-48页
第五章 仿真分析第48-59页
   ·仿真中的机械参数第48-49页
   ·性能比较及参数确定第49-51页
     ·策略比较第49-50页
     ·学习速率的影响第50-51页
   ·机械臂轨迹规划第51-54页
     ·二自由度机械臂轨迹规划第51-52页
     ·策略间轨迹规划比较第52-54页
   ·算法扩展性第54-58页
     ·三自由度性能评估第54-56页
     ·三自由度机械臂轨迹规划第56-58页
   ·本章小结第58-59页
结论第59-60页
发表文章目录第60-61页
致谢第61-62页
参考文献第62-66页
详细摘要第66-74页

论文共74页,点击 下载论文
上一篇:时滞不确定系统的鲁棒容错控制设计
下一篇:LPV重复过程的鲁棒控制方法研究