首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于高斯过程的强化学习算法的研究及实现

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-17页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究现状及发展趋势第10-14页
        1.2.1 强化学习的国内外研究现状第10-11页
        1.2.2 高斯过程的国内外研究现状第11-12页
        1.2.3 高斯过程模型在强化学习中的应用第12-13页
        1.2.4 当前存在的问题及发展趋势第13-14页
    1.3 本文主要研究内容第14-15页
    1.4 论文组织结构第15-17页
第2章 强化学习算法的研究第17-25页
    2.1 强化学习模型及其要素分析第17-19页
        2.1.1 强化学习基本模型的分析第17-18页
        2.1.2 强化学习的要素分析第18-19页
    2.2 强化学习算法的研究第19-24页
        2.2.1 强化学习的要素分析第19-20页
        2.2.2 强化学习的关键算法的研究第20-24页
    2.3 本章小结第24-25页
第3章 高斯过程模型及相关理论第25-37页
    3.1 高斯过程基础-贝叶斯定理第25页
    3.2 从两个视角理解高斯过程模型第25-33页
        3.2.1 权空间视角第26-29页
        3.2.2 函数空间视角第29-33页
    3.3 GP中核函数的确定第33-35页
    3.4 高斯过程超参数选择第35页
    3.5 本章小结第35-37页
第4章 基于高斯过程的强化学习算法的研究第37-58页
    4.1 引言第37-38页
    4.2 基于高斯过程的强化学习算法的学习框架的研究第38-50页
        4.2.1 基于模型的策略搜索框架的分析第38-40页
        4.2.2 运用高斯模型对强化学习中外界环境进行建模第40-41页
        4.2.3 采用改进算法预估输出状态的分布函数第41-48页
        4.2.4 基于梯度的策略优化的算法研究第48-50页
    4.3 采用改进算法进行策略学习的具体实现步骤第50-56页
        4.3.1 采用改进算法计算基于控制的预测分布第50页
        4.3.2 约束控制信号的具体实现算法第50-52页
        4.3.3 初始策略的分析研究第52-54页
        4.3.4 计算后继状态分布第54-55页
        4.3.5 代价函数的改进第55-56页
    4.4 本章小结第56-58页
第5章 基于GP的强化学习算法的实验系统的设计及结果分析第58-75页
    5.1 实验系统介绍第58-63页
    5.2 实验目的及流程介绍第63-65页
        5.2.1 实验目标第63-64页
        5.2.2 实验流程第64-65页
    5.3 实验测试流程第65-66页
    5.4 输出结果分析第66-74页
    5.5 本章小结第74-75页
第6章 全文总结与展望第75-77页
    6.1 全文工作总结第75-76页
    6.2 展望第76-77页
致谢第77-78页
参考文献第78-81页

论文共81页,点击 下载论文
上一篇:增益包络探测方法提高BOTDA的性能研究
下一篇:多足机器人平台控制系统的研究与实现