空间大型天线反射面形状调控系统的主动学习控制方法研究

摘要	第5-6页
ABSTRACT	第6-7页
符号对照表	第11-13页
缩略语对照表	第13-16页
第一章绪论	第16-24页
1.1 课题背景及意义	第16-17页
1.2 主动控制技术的研究现状	第17-19页
1.3 学习控制的发展和研究现状	第19-21页
1.4 论文主要工作	第21-24页
第二章理论基础	第24-36页
2.1 强化学习	第24-28页
2.1.1 马尔可夫决策过程	第24-25页
2.1.2 动态规划	第25-26页
2.1.3 蒙特卡洛	第26-27页
2.1.4 时间差分	第27-28页
2.2 强化学习的改进	第28-32页
2.2.1 探索利用平衡	第28-29页
2.2.2 时间信度分配	第29页
2.2.3 泛化能力	第29-31页
2.2.4 维数灾难	第31页
2.2.5 分层强化学习	第31-32页
2.3 模糊近似强化学习	第32-34页
2.3.1 模糊控制器	第32-33页
2.3.2 模糊近似的强化学习	第33-34页
2.4 本章小结	第34-36页
第三章 5米大型天线反射面的建模和控制	第36-48页
3.1 5米大型天线反射面调整系统的构造	第36-37页
3.2 5米大型天线反射面调整系统的建模	第37-39页
3.3 多变量离散LQR控制	第39-44页
3.3.1 控制器设计	第39-41页
3.3.2 仿真分析	第41-44页
3.4 多变量不确定性问题	第44-46页
3.5 本章小结	第46-48页
第四章基于参考模型的Q学习控制	第48-66页
4.1 不确定性来源及解决思路	第48-49页
4.2 参考模型Q学习算法	第49-54页
4.2.1 基于模型参考的解耦控制	第49-51页
4.2.2 基于Q学习的参数补偿	第51-53页
4.2.3 算法步骤	第53-54页
4.3 多工况下反射面的变形控制	第54-56页
4.4 仿真分析	第56-63页
4.4.1 反射面变形控制仿真分析	第56-60页
4.4.2 多工况变形控制仿真分析	第60-63页
4.5 可变模型干扰下的变形控制问题	第63-64页
4.6 本章小结	第64-66页
第五章基于RBF模糊神经网络的参考模型Q学习控制	第66-82页
5.1 强化学习的经验迁移	第66-67页
5.2 基于RBF模糊神经网络的参考模型Q学习算法	第67-73页
5.2.1 层次结构	第67-70页
5.2.2 参数改进	第70-72页
5.2.3 算法步骤	第72-73页
5.3 基于Boltzmann策略的多工况控制	第73-74页
5.4 联合仿真	第74-80页
5.4.1 可变模型扰动问题的联合仿真	第74-78页
5.4.2 多工况问题的联合仿真	第78-80页
5.5 本章小结	第80-82页
第六章总结与展望	第82-84页
6.1 总结	第82-83页
6.2 展望	第83-84页
参考文献	第84-88页
致谢	第88-90页
作者简介	第90-91页