摘要 | 第1-6页 |
ABSTRACT | 第6-7页 |
致谢 | 第7-10页 |
插图清单 | 第10-11页 |
表格清单 | 第11-12页 |
第一章 绪论 | 第12-18页 |
·SMDP简介 | 第12-13页 |
·Markov决策理论的发展历史及研究现状 | 第13-15页 |
·SMDP的鲁棒控制问题 | 第15-16页 |
·本文内容和结构安排 | 第16-18页 |
第二章 半Markov决策过程及其优化理论 | 第18-28页 |
·半Markov决策过程 | 第18-23页 |
·SMDP的数学模型 | 第18-19页 |
·SMDP的等价无穷小生成子和等价Markov过程 | 第19-22页 |
·SMDP的α-一致化Markov链 | 第22-23页 |
·SMDP的性能势及最优性方程 | 第23-26页 |
·SMDP的性能势 | 第23-24页 |
·基于性能势的最优性方程和最优性定理 | 第24-26页 |
·不确定SMDP的数学模型及鲁棒控制目标 | 第26-28页 |
第三章 遍历链SMDP的鲁棒控制求解 | 第28-42页 |
·参数不相关的鲁棒控制求解 | 第28-35页 |
·策略迭代算法(PI) | 第29页 |
·基于PI的鲁棒决策算法及其收敛性分析 | 第29-33页 |
·数值例子及实验结果 | 第33-35页 |
·参数相关的鲁棒控制求解 | 第35-41页 |
·遗传算法(GA) | 第36-38页 |
·基于GA的鲁棒决策算法 | 第38-39页 |
·数值例子及实验结果 | 第39-41页 |
·本章小结 | 第41-42页 |
第四章 多链SMDP的鲁棒控制求解 | 第42-57页 |
·多链SMDP的数学模型 | 第42-45页 |
·多链SMDP的性能势和最优性方程 | 第45-47页 |
·参数不相关的鲁棒控制求解 | 第47-50页 |
·多链结构下的策略迭代算法 | 第47-49页 |
·数值例子及实验结果 | 第49-50页 |
·参数相关的鲁棒控制求解 | 第50-56页 |
·并行遗传算法(PGA) | 第51-52页 |
·基于PGA的鲁棒决策算法 | 第52-53页 |
·数值例子及实验结果 | 第53-56页 |
·本章小结 | 第56-57页 |
第五章 总结与展望 | 第57-59页 |
参考文献 | 第59-64页 |
攻读硕士学位期间发表的论文 | 第64页 |