| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 目录 | 第8-10页 |
| 第一章 绪论 | 第10-14页 |
| ·随机Markovian跳变系统及最优控制研究现状 | 第10-11页 |
| ·基于强化学习求解优化控制问题的研究现状 | 第11-12页 |
| ·本文的创作动机及创新点 | 第12-13页 |
| ·本文的结构安排 | 第13-14页 |
| 第二章 连续时间线性随机Markovian跳变系统的最优化控制器在线设计算法研究 | 第14-31页 |
| ·问题描述 | 第14-17页 |
| ·并行算法离线求解耦合代数Riccati方程 | 第17-18页 |
| ·子系统转换 | 第18-20页 |
| ·一种新的策略迭代算法 | 第20-23页 |
| ·在线实现新的策略迭代算法 | 第23-26页 |
| ·数值仿真 | 第26-30页 |
| ·本章小结 | 第30-31页 |
| 第三章 基于并行Kleinman迭代算法求解连续时间Markovian跳变线性系统优化H_∞控制器 | 第31-50页 |
| ·问题描述 | 第31-33页 |
| ·直接并行Kleinman迭代算法 | 第33-37页 |
| ·广义并行Kleinman迭代算法 | 第37-39页 |
| ·数值示例 | 第39-48页 |
| ·算法1:直接并行Kleinman迭代算法 | 第40页 |
| ·算法2:广义并行Kleinman迭代算法 | 第40-48页 |
| ·本章小结 | 第48-50页 |
| 第四章 基于一种新的在线策略迭代算法设计连续时间线性随机Markovian跳变系统的H_∞优化控制器 | 第50-67页 |
| ·问题描述 | 第50-52页 |
| ·基于DPKIA的子系统转换 | 第52-55页 |
| ·一种新的策略迭代算法 | 第55-57页 |
| ·在线实现新的策略迭代算法 | 第57-58页 |
| ·仿真示例 | 第58-66页 |
| ·利用DPKIA求解给定H_∞控制问题 | 第59-62页 |
| ·应用新的在线策略迭代算法求解给定H_∞控制问题 | 第62-66页 |
| ·本章小结 | 第66-67页 |
| 第五章 总结与展望 | 第67-70页 |
| ·本文的主要工作及贡献 | 第67-68页 |
| ·前景与展望 | 第68-70页 |
| 参考文献 | 第70-77页 |
| 致谢 | 第77-79页 |
| 攻读学位期间发表的学术论文目录 | 第79-81页 |