基于强化学习的PSS最优控制策略的研究

摘要	第1-7页
Abstract	第7-11页
第一章绪论	第11-21页
·课题研究背景	第11-12页
·低频振荡研究现状	第12-16页
·低频振荡的概念	第12-13页
·低频振荡的研究机理	第13-16页
·低频振荡的控制方法	第16-18页
·现有PSS 优化方法的不足点	第18-19页
·本文主要研究内容	第19-21页
第二章理论介绍与仿真建模	第21-39页
·强化学习	第21-23页
·马尔可夫决策过程	第21页
·强化学习算法	第21-23页
·Q-学习方法介绍	第23-25页
·Q(λ)学习方法	第25-27页
·资格迹在强化学习中的应用	第25-26页
·Q(λ)学习算法	第26-27页
·R(λ)学习方法	第27-30页
·仿真建模	第30-37页
·本章小结	第37-39页
第三章基于折扣型强化学习的PSS 参数优化	第39-53页
·PSS 模型结构	第39-40页
·状态划分设置	第40-41页
·奖励函数设置	第41-42页
·仿真研究	第42-51页
·奖励函数选取比较	第43-47页
·算法效果比较	第47-51页
·本章小结	第51-53页
第四章基于折扣型强化学习的PSS 控制器	第53-63页
·控制器结构	第53页
·状态划分与奖励函数设置	第53-55页
·仿真研究	第55-62页
·Q(λ)与Q 学习算法在两种扰动下的收敛性比较	第56-58页
·权值系数a_P、a_w、a_V 的影响	第58-59页
·区域联络线路上发生三相短路	第59-60页
·改变线路阻抗值	第60-62页
·本章小结	第62-63页
第五章基于平均报酬型强化学习的PSS 控制器	第63-70页
·R(λ)学习算法设计	第63-64页
·R(λ)学习算法流程	第64页
·仿真分析	第64-68页
·算法收敛性	第65-66页
·区域联络线路上发生三相短路	第66-67页
·改变线路阻抗值	第67-68页
·本章小结	第68-70页
总结	第70-72页
参考文献	第72-77页
攻读硕士学位期间取得的研究成果	第77-78页
致谢	第78-79页
附件	第79页