首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于强化学习的限定代价下卷积神经网络结构自动化设计

摘要第4-5页
abstract第5-6页
第1章 引言第11-15页
    1.1 研究背景第11页
    1.2 相关研究第11-14页
        1.2.1 神经网络结构自动化设计第11-13页
        1.2.2 神经网络结构代价优化第13-14页
    1.3 本文结构第14-15页
第2章 基于强化学习的卷积网结构自动化设计第15-31页
    2.1 卷积神经网简介第15-19页
        2.1.1 卷积网主要结构超参数第15-16页
        2.1.2 经典卷积网结构第16-19页
    2.2 强化学习简介第19-20页
    2.3 基于Q学习方法第20-24页
        2.3.1 Q学习算法第20-21页
        2.3.2 基本原理第21-24页
    2.4 基于策略梯度方法第24-26页
        2.4.1 策略梯度算法第24-25页
        2.4.2 基本原理第25-26页
    2.5 提升训练效率方法第26-27页
    2.6 不同方法对比分析第27-31页
第3章 限定代价下卷积网结构自动化设计第31-35页
    3.1 BSN方法第31-33页
        3.1.1 定义搜索空间第31页
        3.1.2 采样网络结构第31-32页
        3.1.3 参数训练第32-33页
    3.2 BSN缺点及改进方向第33-35页
第4章 一种基于策略梯度的限定代价下卷积网结构自动化设计方法第35-49页
    4.1 基本原理第35-42页
        4.1.1 采样网络结构并训练第37-39页
        4.1.2 计算即时奖励第39页
        4.1.3 训练代理第39-40页
        4.1.4 B-ENAS伪代码第40-42页
    4.2实验第42-45页
        4.2.1 实验设置第42-44页
        4.2.2 实验结果第44-45页
    4.3 讨论第45-49页
第5章 总结与展望第49-51页
    5.1 本文工作总结第49-50页
    5.2 未来工作展望第50-51页
参考文献第51-55页
致谢第55-57页
作者简历及攻读学位期间发表的学术论文与研究成果第57页

论文共57页,点击 下载论文
上一篇:基于集成的多深度确定性策略梯度的无人驾驶策略研究
下一篇:基于深度学习的地铁短时客流预测方法研究