首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--自动控制理论论文

基于强化学习的倒立摆控制

摘要第1-5页
Abstract第5-9页
目录第9-12页
一 绪论第12-16页
 1 引言第12-13页
 2 本文的主要内容第13-16页
二 机器学习概述第16-26页
 1 机器学习发展史第16-18页
 2 强化学习第18-26页
  (1) 环境第19-20页
  (2) 对用户需求的适应--情感计算第20-22页
  (3) 统计机器学习第22-23页
  (4) 基于符号的归纳机器学习第23-24页
  (5) 进化机器学习第24-26页
三 强化学习第26-48页
 1 强化学习的生物学原理第26-27页
 2 强化学习标准模型第27-28页
 3 强化学习的发展及研究现状第28-31页
 4 强化学习的主要算法第31-36页
  (1) 瞬时差分方法(TD)第31-33页
  (2) Q-学习算法第33-34页
  (3) 自适应启发评价算法(AHC)第34-36页
 5 学习性能的常用测试标准第36-37页
  (1) 算法的最终的收敛性第36-37页
  (2) 算法的收敛速度第37页
 6 强化学习中的勘探与开采第37-39页
  (1) 贪婪策略第37-38页
  (2) 随机化策略第38页
  (3) 基于区间(interval-based)的技巧第38-39页
 7 强化学习的应用第39-40页
  (1) 在游戏比赛中的应用第39页
  (2) 在控制系统中的应用第39-40页
  (3) 在机器人中的应用第40页
  (4) 在调度管理中的应用第40页
 8 结论第40-42页
  (1) 系统地研究强化学习理论第41页
  (2) 强化学习的应用研究第41页
  (3) 强化学习速度的理论和方法研究第41-42页
 9 相关资源第42-48页
四 倒立摆第48-54页
 1 研究倒立摆的意义第48-49页
 2 倒立摆研究现状第49-54页
  (1) 传统控制方法在倒立摆控制中的应用第49-50页
  (2) 人工智能控制方法在倒立摆控制中的应用第50-54页
五 基于强化学习的倒立摆控制第54-68页
 1 基于规则表学习的一阶倒立摆控制第54-60页
  (1) 偏角、位移和力的方向的规定第55页
  (2) 控制规则表第55-56页
  (3) 控制规则表的多维线性插值第56页
  (4) 学习方法第56-57页
  (5) 学习停止准则第57页
  (6) 算法的总体框架第57页
  (7) 实验结果分析第57-60页
  (8) 结论第60页
 2 学习一阶倒立摆控制方程的系数第60-63页
  (1) 一阶倒立摆控制方程第60-61页
  (2) 学习原理第61页
  (3) 算法的实现框架第61-62页
  (4) 实验结果分析第62-63页
 3 学习二阶倒立摆控制方程的系数第63-68页
  (1) 二阶倒立摆系统简介第63页
  (2) 学习原理第63-64页
  (3) 算法的实现框架第64页
  (4) 实验结果分析第64-66页
  (5) 结论第66-68页
六 结论第68-70页
参考文献第70-80页
附录第80-82页
 附录1 ML和RL术语表第80-82页
致谢第82-84页
在学期间发表的论文第84页

论文共84页,点击 下载论文
上一篇:三相骨显像在肿瘤病灶探测中的应用研究
下一篇:清热解毒法为主治疗皮肌炎的临床研究