首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--自动控制理论论文

强化学习在倒立摆起摆及平衡控制中的应用研究

摘要第3-4页
Abstract第4-5页
1 绪论第8-14页
    1.1 研究背景及意义第8-9页
    1.2 国内外研究现状第9-12页
        1.2.1 倒立摆的起摆控制研究现状第9-10页
        1.2.2 倒立摆平衡控制研究现状第10-12页
    1.3 研究工作及内容安排第12-14页
2 理论基础第14-22页
    2.1 引言第14页
    2.2 直线一阶倒立摆基础理论第14-17页
        2.2.1 直线一阶倒立摆工作原理第14页
        2.2.2 直线一阶倒立摆建模及性能分析第14-17页
    2.3 强化学习基础理论第17-21页
        2.3.1 强化学习基础概念第17-18页
        2.3.2 马尔可夫决策过程第18-19页
        2.3.3 强化学习模型及四要素第19-20页
        2.3.4 强化学习常用算法第20-21页
    2.4 小结第21-22页
3 基于Q学习的倒立摆起摆控制第22-26页
    3.1 引言第22页
    3.2 倒立摆起摆问题描述第22页
    3.3 Q学习算法第22-23页
    3.4 实验结果及分析第23-24页
    3.5 小结第24-26页
4 基于最小二乘策略迭代(LSPI)的倒立摆平衡控制第26-34页
    4.1 引言第26页
    4.2 基于LSPI的倒立摆平衡控制算法框架第26-27页
    4.3 LSTD-Q策略评估算法第27-29页
        4.3.1 最小二乘时间差分算法(LSTD)第27页
        4.3.2 LSTD-Q算法第27-29页
    4.4 最小二乘策略迭代的具体实现流程第29-30页
    4.5 实验结果及分析第30-33页
    4.6 小结第33-34页
5 基于稀疏核机器的最小二乘策略迭代( KLSPI)的倒立摆平衡控制第34-46页
    5.1 引言第34页
    5.2 KLSPI的倒立摆平衡控制算法框架第34-35页
    5.3 基于稀疏核机器的KLSTD-Q策略评估算法第35-39页
        5.3.1 基于近似线性相关分析(ALD)的稀疏核机器算法第35-36页
        5.3.2 基于稀疏核机器的KLSTD-Q策略评估算法第36-39页
    5.4 基于稀疏核机器的最小二乘策略迭代的具体实现流程第39-40页
    5.5 实验结果及分析第40-44页
    5.6 小结第44-46页
6 基于极限学习机的最小二乘策略迭代的倒立摆平衡控制第46-56页
    6.1 引言第46页
    6.2 极限学习机(ELM)简介第46-47页
    6.3 基于ELM-LSPI的倒立摆平衡控制算法框架第47-48页
    6.4 基于ELM的最小二乘时间差分策略评估算法第48页
    6.5 基于ELM的最小二乘策略迭代的具体实现流程第48-49页
    6.6 实验结果及分析第49-55页
    6.7 小结第55-56页
7 总结与展望第56-58页
    7.1 总结第56-57页
    7.2 展望第57-58页
致谢第58-60页
参考文献第60-63页

论文共63页,点击 下载论文
上一篇:基于重复模式检测的绝缘子定位算法研究
下一篇:基于深度学习的复杂交通视频的多目标跟踪