首页--工业技术论文--电工技术论文--输配电工程、电力网及电力系统论文--电力系统的调度、管理、通信论文--电力系统的运行论文

基于Shaping—确定策略梯度的智能操作票系统的研究

摘要第6-7页
abstract第7-8页
第1章 绪论第11-17页
    1.1 课题研究的背景及意义第11-12页
    1.2 相关研究的国内外现状第12-14页
        1.2.1 操作票系统的研究现状第12-13页
        1.2.2 强化学习的研究现状第13-14页
    1.3 目前操作票系统存在的不足第14-15页
    1.4 本文研究内容第15-17页
第2章 强化学习相关理论第17-25页
    2.1 强化学习第17-22页
        2.1.1 时序差分学习算法第18-19页
        2.1.2 策略梯度学习算法第19-21页
        2.1.3 Actor-Critic算法第21页
        2.1.4 Shaping技术第21-22页
    2.2 深度学习第22-23页
        2.2.1 卷积神经网络第22-23页
        2.2.2 深度强化学习第23页
        2.2.3 TensorFlow和TensorLayer技术第23页
    2.3 本章小结第23-25页
第3章 操作票系统总体设计第25-33页
    3.1 需求及特性分析第25-27页
        3.1.1 需求性分析第25-26页
        3.1.2 操作票特性分析第26页
        3.1.3 系统操作流程第26-27页
    3.2 电力网络建模第27-29页
    3.3 系统模块分析第29-32页
        3.3.1 交互模块第29页
        3.3.2 控制模块第29页
        3.3.3 数据库模块第29-32页
    3.4 本章小结第32-33页
第4章 Shaping确定性策略梯度推理方法的实现第33-52页
    4.1 推理网络结构模型第33-34页
    4.2 数据处理第34-35页
    4.3 推理算法第35-42页
        4.3.1 确定策略梯度算法第36-38页
        4.3.2 Shaping确定性策略梯度算法第38-39页
        4.3.3 网络训练方法第39-41页
        4.3.4 Shaping-DPG流程第41-42页
    4.4 消除数据相关性第42-44页
        4.4.1 经验回放第42-43页
        4.4.2 目标网络法第43-44页
    4.5 回报函数第44-50页
        4.5.1 电力安全制度第45-46页
        4.5.2 网络评估函数第46-49页
        4.5.3 立即回报函数第49-50页
    4.6 完整算法流程第50-51页
    4.7 本章小结第51-52页
第5章 实例分析第52-57页
    5.1 实例分析第52-55页
        5.1.1 学习曲线第53-54页
        5.1.2 方法对比第54-55页
    5.2 自动开票第55页
    5.3 操作票管理第55-56页
    5.4 本章小结第56-57页
结论第57-59页
致谢第59-60页
参考文献第60-63页
攻读硕士学位期间发表的论文及科研成果第63页

论文共63页,点击 下载论文
上一篇:基于广域量测的电力系统低频振荡模式辨识与振荡源定位
下一篇:机车用燃料电池混合动力缩比系统设计