首页--工业技术论文--机械、仪表工业论文--机械工厂(车间)论文--生产技术管理论文

基于深度强化学习的离散型制造企业车间动态调度研究

摘要第3-5页
英文摘要第5-11页
1 绪论第11-21页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-18页
        1.2.1 实际生产车间调度流程[9]第12-13页
        1.2.2 动态车间调度策略的研究现状第13-15页
        1.2.3 动态车间调度优化算法的研究现状第15-16页
        1.2.4 强化学习在动态车间调度问题的研究现状第16-18页
        1.2.5 国内外现状研究总结第18页
    1.3 论文研究内容及组织结构第18-20页
        1.3.1 论文的研究内容第18-19页
        1.3.2 论文的组织结构第19-20页
    1.4 本章小结第20-21页
2 深度强化学习理论及其在人工调整中的应用方案第21-29页
    2.1 引言第21页
    2.2 强化学习概述[63]第21-23页
        2.2.1 智能体的概念第21页
        2.2.2 强化学习基本概念第21-22页
        2.2.3 马尔可夫决策过程第22页
        2.2.4 Q-learning第22-23页
    2.3 深度强化学习概述[66]第23-26页
        2.3.1 Deep Q-network算法第23-25页
        2.3.2 DPG算法第25页
        2.3.3 Actor-Citic算法第25-26页
        2.3.4 DDPG算法第26页
    2.4 车间调度人工调整及其模拟策略第26-28页
        2.4.1 人工调整分类及调整策略第26-28页
        2.4.2 基于深度学习、深度强化学习的人工调整问题研究路线第28页
    2.5 本章小结第28-29页
3 基于深度学习的隐性扰动下人工调整策略模拟第29-39页
    3.1 引言第29-30页
    3.2 隐性扰动下人工调整数据样本生成第30-36页
        3.2.1 调整时刻点确定第30页
        3.2.2 深度网络的输入第30页
        3.2.3 深度网络的输出标签第30-32页
        3.2.4 遗传算法仿真产生样本数据第32-36页
    3.3 基于深度学习的人工调整方式选择实现第36-38页
        3.3.1 数据预处理第36-37页
        3.3.2 深度强化学习网络实现第37-38页
    3.4 本章小结第38-39页
4 深度强化学习在动态车间调度问题上的应用第39-51页
    4.1 引言第39页
    4.2 车间调度问题描述第39-41页
        4.2.1 符号说明第39-40页
        4.2.2 假设条件第40-41页
        4.2.3 目标函数第41页
    4.3 车间调度问题的转化第41-44页
        4.3.1 状态空间第41-42页
        4.3.2 动作空间第42-43页
        4.3.3 奖惩函数第43页
        4.3.4 环境搭建第43-44页
    4.4 深度强化学习算法第44-49页
        4.4.1 动作探索策略第44页
        4.4.2 激活函数的选择第44-46页
        4.4.3 DDPG算法第46-49页
    4.5 实例验证第49-50页
    4.6 本章小结第50-51页
5 实例分析及可视化平台搭建第51-57页
    5.1 引言第51页
    5.2 环境模型配置第51-52页
        5.2.1 开发环境第51页
        5.2.2 测试环境第51-52页
    5.3 静态环境第52-53页
    5.4 动态环境第53-54页
    5.5 大规模算例第54-55页
    5.6 系统界面搭建第55-56页
    5.7 本章小结第56-57页
6 总结与展望第57-59页
    6.1 总结第57页
    6.2 展望第57-59页
致谢第59-61页
参考文献第61-65页

论文共65页,点击 下载论文
上一篇:高速微切削测力平台的设计与试验研究
下一篇:秦岭林药复合系统中药材植物淋出物对阔叶树种枯落物分解的影响