首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

强化学习及其在机器人系统中的应用研究

摘要第1-6页
ABSTRACT第6-9页
目录第9-12页
CONTENTS第12-15页
第一章 绪论第15-28页
   ·强化学习的研究背景与意义第15-16页
   ·强化学习的主要研究内容第16-18页
   ·强化学习的国内外研究现状及分析第18-25页
     ·强化学习理论的研究现状及分析第18-20页
     ·强化学习算法的研究现状及分析第20-21页
     ·强化学习应用的研究现状及分析第21-25页
   ·本文的主要研究工作及章节安排第25-28页
     ·主要研究工作第25-26页
     ·章节安排第26-28页
第二章 基于递推最小二乘法的多步时序差分学习研究第28-44页
   ·引言第28页
   ·强化学习的基本概念与原理第28-36页
     ·强化学习基本原理和基本模型第29-30页
     ·强化学习的主要组成要素第30-31页
     ·强化学习的主要算法第31-34页
     ·马氏决策过程第34-36页
   ·基于递推最小二乘的多步时序差分学习(RLS-TD(λ))算法第36-43页
     ·RLS-TD(λ)算法描述第37-38页
     ·RLS-TD(λ)算法收敛性分析及其值函数误差估计第38-40页
     ·RLS-TD(λ)算法的迷宫仿真实验第40-43页
   ·本章小结第43-44页
第三章 基于RBF神经网络的强化学习研究第44-61页
   ·引言第44页
   ·基本Actor-Critic学习模型第44-46页
   ·基于RBF网络的强化学习(RBF-AC)算法第46-52页
     ·RBF-AC算法描述第46-49页
     ·RBF-AC算法步骤第49-50页
     ·RBF-AC算法的收敛性分析第50-52页
   ·基于RBF-AC算法的自适应PID(AC-PID)控制第52-60页
     ·AC-PID控制器结构第52-55页
     ·AC-PID控制器的设计流程第55页
     ·仿真实验第55-60页
   ·本章小结第60-61页
第四章 基于探索度的改进型模糊Sarsa学习研究第61-74页
   ·引言第61-62页
   ·模糊Sarsa学习第62-63页
   ·基于探索度的改进型模糊Sarsa学习(IFSL)算法第63-73页
     ·自适应学习率产生器第64-65页
     ·模糊平衡器第65-66页
     ·IFSL算法步骤第66-67页
     ·IFSL算法收敛性分析第67-68页
     ·小车爬山问题仿真实验第68-73页
   ·本章小结第73-74页
第五章 基于变学习率的模糊Sarsa学习研究第74-85页
   ·引言第74页
   ·蚁群优化计算的基本概念第74-76页
   ·基于蚁群优化变学习率的模糊Sarsa学习(ACO-FSL)算法第76-84页
     ·ACO-FSL系统结构第76-77页
     ·蚁群优化(ACO)第77-78页
     ·动作的选择第78-79页
     ·ACO-FSL算法步骤第79-80页
     ·仿真实验第80-84页
   ·本章小结第84-85页
第六章 强化学习在移动机器人路径规划中的应用研究第85-99页
   ·引言第85页
   ·已有的移动机器人路径规划方法简介第85-87页
     ·传统路径规划方法第86页
     ·智能路径规划方法第86-87页
   ·强化学习在移动机器人路径规划中的应用第87-97页
     ·移动机器人的状态描述第89-92页
     ·移动机器人的回报函数设计第92-93页
     ·移动机器人动作选择的设计第93-94页
     ·仿真实验环境第94-95页
     ·实验结果及分析第95-97页
   ·本章小结第97-99页
总结第99-101页
参考文献第101-111页
攻读博士学位期间发表或完成的论文第111-114页
致谢第114页

论文共114页,点击 下载论文
上一篇:无线传感器网络中能源高效的视频信号压缩关键技术研究
下一篇:鼻炎的炎症特征及其与下气道炎症及气道高反应性的关系