首页--工业技术论文--无线电电子学、电信技术论文--无线电设备、电信设备论文--天线论文--一般性问题论文

空间大型天线反射面形状调控系统的主动学习控制方法研究

摘要第5-6页
ABSTRACT第6-7页
符号对照表第11-13页
缩略语对照表第13-16页
第一章 绪论第16-24页
    1.1 课题背景及意义第16-17页
    1.2 主动控制技术的研究现状第17-19页
    1.3 学习控制的发展和研究现状第19-21页
    1.4 论文主要工作第21-24页
第二章 理论基础第24-36页
    2.1 强化学习第24-28页
        2.1.1 马尔可夫决策过程第24-25页
        2.1.2 动态规划第25-26页
        2.1.3 蒙特卡洛第26-27页
        2.1.4 时间差分第27-28页
    2.2 强化学习的改进第28-32页
        2.2.1 探索利用平衡第28-29页
        2.2.2 时间信度分配第29页
        2.2.3 泛化能力第29-31页
        2.2.4 维数灾难第31页
        2.2.5 分层强化学习第31-32页
    2.3 模糊近似强化学习第32-34页
        2.3.1 模糊控制器第32-33页
        2.3.2 模糊近似的强化学习第33-34页
    2.4 本章小结第34-36页
第三章 5米大型天线反射面的建模和控制第36-48页
    3.1 5米大型天线反射面调整系统的构造第36-37页
    3.2 5米大型天线反射面调整系统的建模第37-39页
    3.3 多变量离散LQR控制第39-44页
        3.3.1 控制器设计第39-41页
        3.3.2 仿真分析第41-44页
    3.4 多变量不确定性问题第44-46页
    3.5 本章小结第46-48页
第四章 基于参考模型的Q学习控制第48-66页
    4.1 不确定性来源及解决思路第48-49页
    4.2 参考模型Q学习算法第49-54页
        4.2.1 基于模型参考的解耦控制第49-51页
        4.2.2 基于Q学习的参数补偿第51-53页
        4.2.3 算法步骤第53-54页
    4.3 多工况下反射面的变形控制第54-56页
    4.4 仿真分析第56-63页
        4.4.1 反射面变形控制仿真分析第56-60页
        4.4.2 多工况变形控制仿真分析第60-63页
    4.5 可变模型干扰下的变形控制问题第63-64页
    4.6 本章小结第64-66页
第五章 基于RBF模糊神经网络的参考模型Q学习控制第66-82页
    5.1 强化学习的经验迁移第66-67页
    5.2 基于RBF模糊神经网络的参考模型Q学习算法第67-73页
        5.2.1 层次结构第67-70页
        5.2.2 参数改进第70-72页
        5.2.3 算法步骤第72-73页
    5.3 基于Boltzmann策略的多工况控制第73-74页
    5.4 联合仿真第74-80页
        5.4.1 可变模型扰动问题的联合仿真第74-78页
        5.4.2 多工况问题的联合仿真第78-80页
    5.5 本章小结第80-82页
第六章 总结与展望第82-84页
    6.1 总结第82-83页
    6.2 展望第83-84页
参考文献第84-88页
致谢第88-90页
作者简介第90-91页

论文共91页,点击 下载论文
上一篇:高性能频率选择表面的研究与设计
下一篇:基于度量学习的极化SAR图像地物分类技术研究