基于Q学习算法的机械臂轨迹规划研究

摘要	第1-5页
ABSTRACT	第5-7页
创新点摘要	第7-10页
第一章绪论	第10-15页
·课题的来源、目的及研究意义	第10-11页
·国内外研究现状	第11-14页
·机器人分类	第11页
·机械臂的控制	第11-12页
·强化学习研究现状	第12-14页
·本文的主要工作	第14-15页
第二章机械臂控制系统分析	第15-23页
·机械臂结构分析	第15-17页
·机械臂的坐标变换	第17-20页
·机械臂控制参量的选择	第20-22页
·本章小结	第22-23页
第三章改进 Q 学习控制算法	第23-37页
·马尔可夫环境下的 Q 学习算法	第23-25页
·Q 算法学习在机器人路径寻优中的应用	第25-30页
·多智能体的状态相关性	第30-32页
·改进算法的收敛性证明	第32-35页
·状态耦合 Q 算法的泛化能力分析	第35-36页
·本章小结	第36-37页
第四章控制器策略改进	第37-48页
·机械臂轨迹规划控制器设计	第37-38页
·控制器中状态感知器设计	第38页
·基于动态贪婪策略的动作选择器	第38-43页
·ε-greedy 算法	第39-40页
·模拟退火算法	第40-41页
·动态贪婪策略	第41-43页
·评价措施及其定量评价单元	第43-45页
·学习经验在线更新机构	第45-47页
·本章小结	第47-48页
第五章仿真分析	第48-59页
·仿真中的机械参数	第48-49页
·性能比较及参数确定	第49-51页
·策略比较	第49-50页
·学习速率的影响	第50-51页
·机械臂轨迹规划	第51-54页
·二自由度机械臂轨迹规划	第51-52页
·策略间轨迹规划比较	第52-54页
·算法扩展性	第54-58页
·三自由度性能评估	第54-56页
·三自由度机械臂轨迹规划	第56-58页
·本章小结	第58-59页
结论	第59-60页
发表文章目录	第60-61页
致谢	第61-62页
参考文献	第62-66页
详细摘要	第66-74页