首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于自主优先课程学习的深度强化学习算法研究

摘要第5-6页
ABSTRACT第6页
第一章 绪论第9-13页
    1.1 研究背景与意义第9-10页
    1.2 研究现状第10-11页
    1.3 本文的研究内容第11-12页
    1.4 本文的章节安排第12-13页
第二章 深度强化学习第13-22页
    2.1 强化学习第13-16页
    2.2 深度强化学习第16-21页
        2.2.1 研究进展第16-17页
        2.2.2 深度Q值网络第17-20页
        2.2.3 经验回放第20-21页
    2.3 本章小结第21-22页
第三章 自主优先课程学习算法第22-50页
    3.1 深度课程强化学习第22-26页
    3.2 自主优先课程存储第26-30页
        3.2.1 优先级经验回放第26-28页
        3.2.2 自主优先课程学习第28-30页
    3.3 重复惩罚第30-35页
        3.3.1 神经网络机器翻译中的覆盖机制第31-33页
        3.3.2 覆盖惩罚第33-35页
    3.4 深度课程强化学习算法框架第35-37页
    3.5 实验结果第37-49页
        3.5.1 Atari 2600游戏仿真平台第37-40页
        3.5.2 实验设置第40-45页
        3.5.3 实验结果第45-49页
    3.6 本章小结第49-50页
第四章 DCRL与基于回放的深度强化学习算法的结合第50-58页
    4.1 双值网络第50-54页
        4.1.1 网络结构第50-53页
        4.1.2 实验结果第53-54页
    4.2 分型网络第54-57页
        4.2.1 网络结构第54-56页
        4.2.2 实验结果第56-57页
    4.3 本章小结第57-58页
第五章 总结与展望第58-60页
    5.1 总结第58-59页
    5.2 展望第59-60页
参考文献第60-68页
致谢第68-69页
攻读硕士学位发表的论文第69-70页

论文共70页,点击 下载论文
上一篇:基于压缩卷积神经网络的人脸检测方法
下一篇:柔性OTFT气体传感器的制备及特性研究