首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

面向连续状态的神经网络强化学习研究

致谢第4-5页
摘要第5-6页
Abstract第6-7页
1 绪论第15-22页
    1.1 课题来源第15页
    1.2 研究背景和意义第15-17页
    1.3 国内外研究方法和现状第17-19页
    1.4 研究的主要内容、方法和技术路线第19-20页
    1.5 论文组织结构第20-22页
2 基础理论第22-33页
    2.1 强化学习模型第22-23页
    2.2 马尔科夫决策过程第23-25页
    2.3 强化学习主要算法第25-30页
    2.4 神经网络第30-32页
    2.5 本章小结第32-33页
3 基于资格迹的RBF神经网络强化学习研究第33-44页
    3.1 Sarsa强化学习算法第33-34页
    3.2 RBF神经网络第34-36页
    3.3 基于资格迹的RBF网络学习算法第36-38页
    3.4 仿真研究第38-43页
    3.5 本章小结第43-44页
4 基于ELM-BP神经网络的强化学习研究第44-60页
    4.1 Actor Critic方法第44-46页
    4.2 动作网络BP第46-49页
    4.3 评价网络ELM第49-51页
    4.4 基于资格迹的ELM-BP强化学习第51-53页
    4.5 ELM-BP强化学习在倒立摆控制中的应用第53-59页
    4.6 本章小结第59-60页
5 总结与展望第60-62页
    5.1 总结第60-61页
    5.2 展望第61-62页
参考文献第62-69页
作者简历第69-71页
学位论文数据集第71页

论文共71页,点击 下载论文
上一篇:线性无线传感器网络能耗均衡研究
下一篇:基于层次聚类的不可达路径检测方法研究