首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

Q_learning强化学习算法的改进及应用研究

摘要第5-6页
Abstract第6页
引言第11-12页
1 绪论第12-20页
    1.1 课题背景第12-14页
    1.2 强化学习的发展历史第14-16页
    1.3 国内外研究现状第16页
    1.4 强化学习方法的应用第16-17页
    1.5 强化学习算法中问题第17-18页
    1.6 本文的主要工作第18-19页
    1.7 论文组织结构第19-20页
2 强化学习基本理论第20-32页
    2.1 强化学习模型及其基本要素第20-23页
        2.1.1 强化学习的基本要素第21-22页
        2.1.2 马尔科夫决策过程第22-23页
    2.2 强化学习的主要算法第23-29页
        2.2.1 蒙特卡洛法第23-24页
        2.2.2 时间差分(TD)算法第24-26页
        2.2.3 Q学习与SARSA学习第26-28页
        2.2.4 SARSA学习第28-29页
        2.2.5 Dyna学习框架第29页
    2.3 强化学习中常用的探索策略第29-30页
    2.4 本章小结第30-32页
3 基于启发函数的强化学习算法第32-43页
    3.1 引言第32-33页
    3.2 Q_learning算法第33-35页
        3.2.1 Q_learning算法简介第33页
        3.2.2 Q_learning算法收敛性分析第33-35页
    3.3 Q(λ)算法简介第35-37页
        3.3.1 Q(λ)算法流程第35-37页
    3.4 基于启发函数的强学习算法第37-40页
        3.4.1 启发式奖赏第37-38页
        3.4.2 启发式策略的选择原理第38-40页
    3.5 启发式Q学习第40-42页
    本章小结第42-43页
4 实验与仿真第43-50页
    4.1 引言第43页
    4.2 启发函数的设计第43-45页
    4.3 程序结果第45-47页
    4.4 程序仿真图第47-49页
    4.5 本章小结第49-50页
5 总结与展望第50-52页
    研究总结第50-51页
    工作展望第51-52页
参考文献第52-55页
致谢第55-56页
作者简介及读研期间主要科研成果第56页

论文共56页,点击 下载论文
上一篇:基于电子商务的A物流公司仓储优化研究
下一篇:小波变换在红外图像处理中的应用研究