| 摘要 | 第1-6页 |
| ABSTRACT | 第6-7页 |
| 致谢 | 第7-10页 |
| 插图清单 | 第10-11页 |
| 表格清单 | 第11-12页 |
| 第一章 绪论 | 第12-18页 |
| ·SMDP简介 | 第12-13页 |
| ·Markov决策理论的发展历史及研究现状 | 第13-15页 |
| ·SMDP的鲁棒控制问题 | 第15-16页 |
| ·本文内容和结构安排 | 第16-18页 |
| 第二章 半Markov决策过程及其优化理论 | 第18-28页 |
| ·半Markov决策过程 | 第18-23页 |
| ·SMDP的数学模型 | 第18-19页 |
| ·SMDP的等价无穷小生成子和等价Markov过程 | 第19-22页 |
| ·SMDP的α-一致化Markov链 | 第22-23页 |
| ·SMDP的性能势及最优性方程 | 第23-26页 |
| ·SMDP的性能势 | 第23-24页 |
| ·基于性能势的最优性方程和最优性定理 | 第24-26页 |
| ·不确定SMDP的数学模型及鲁棒控制目标 | 第26-28页 |
| 第三章 遍历链SMDP的鲁棒控制求解 | 第28-42页 |
| ·参数不相关的鲁棒控制求解 | 第28-35页 |
| ·策略迭代算法(PI) | 第29页 |
| ·基于PI的鲁棒决策算法及其收敛性分析 | 第29-33页 |
| ·数值例子及实验结果 | 第33-35页 |
| ·参数相关的鲁棒控制求解 | 第35-41页 |
| ·遗传算法(GA) | 第36-38页 |
| ·基于GA的鲁棒决策算法 | 第38-39页 |
| ·数值例子及实验结果 | 第39-41页 |
| ·本章小结 | 第41-42页 |
| 第四章 多链SMDP的鲁棒控制求解 | 第42-57页 |
| ·多链SMDP的数学模型 | 第42-45页 |
| ·多链SMDP的性能势和最优性方程 | 第45-47页 |
| ·参数不相关的鲁棒控制求解 | 第47-50页 |
| ·多链结构下的策略迭代算法 | 第47-49页 |
| ·数值例子及实验结果 | 第49-50页 |
| ·参数相关的鲁棒控制求解 | 第50-56页 |
| ·并行遗传算法(PGA) | 第51-52页 |
| ·基于PGA的鲁棒决策算法 | 第52-53页 |
| ·数值例子及实验结果 | 第53-56页 |
| ·本章小结 | 第56-57页 |
| 第五章 总结与展望 | 第57-59页 |
| 参考文献 | 第59-64页 |
| 攻读硕士学位期间发表的论文 | 第64页 |