在策略强化学习算法在互联电网AGC最优控制中的应用

摘要	第1-6页
Abstract	第6-11页
第一章绪论	第11-17页
·研究背景	第11-12页
·国内外现状	第12-15页
·经典控制策略	第12页
·智能控制策略	第12-15页
·本文的工作	第15-17页
第二章基础理论介绍	第17-27页
·强化学习算法	第17-20页
·马尔可夫决策过程	第17页
·强化学习的基本原理	第17-19页
·强化学习算法的分类	第19-20页
·AGC 评价标准	第20-23页
·A1/A2 标准	第21页
·CPS 指标	第21-23页
·仿真模型	第23-26页
·基本元件模型	第23-24页
·标准两区域模型	第24-25页
·南方电网模型	第25-26页
·本章小结	第26-27页
第三章基于单步 SARSA 学习的 AGC 控制	第27-45页
·SARSA 学习算法	第27-28页
·基于 SARSA 学习的 CPS 控制器设计	第28-32页
·环境状态集 S	第28页
·奖励函数 R	第28-30页
·概率函数 P	第30页
·动作集 A	第30-31页
·值函数 Q	第31页
·控制器模型	第31页
·控制迭代步骤	第31-32页
·标准两区域仿真	第32-44页
·Simulink 仿真模型	第32-35页
·仿真结果分析	第35-44页
·本章小结	第44-45页
第四章基于多步回溯 SARSA(λ)学习的 AGC 控制	第45-63页
·多步回溯 SARSA(λ )学习算法	第45-48页
·TD(λ )算法	第45-46页
·资格迹	第46-47页
·SARSA(λ )算法	第47-48页
·基于 SARSA(λ )学习的 CPS 控制器设计	第48-51页
·算法模型	第48-49页
·控制器的构建	第49-50页
·控制迭代步骤	第50-51页
·仿真及分析	第51-62页
·标准两区域模型仿真及分析	第51-59页
·南方电网模型仿真及分析	第59-62页
·本章小结	第62-63页
第五章结合函数逼近的 SARSA 学习 AGC 控制	第63-76页
·函数逼近	第63-66页
·函数逼近概念	第63页
·函数逼近的方法	第63-66页
·强化学习与函数逼近	第66-69页
·基于动作空间函数逼近的 SARSA 学习的 CPS 控制器设计	第69-72页
·SARSA 控制器的函数逼近	第69-70页
·动作逼近器的设计	第70-72页
·仿真分析	第72-74页
·本章小结	第74-76页
结论	第76-78页
参考文献	第78-83页
攻读硕士期间获得的研究成果	第83-84页
致谢	第84-85页
答辩委员会对论文的评定意见	第85页