不确定SMDP基于性能势的鲁棒控制研究

摘要	第1-6页
ABSTRACT	第6-7页
致谢	第7-10页
插图清单	第10-11页
表格清单	第11-12页
第一章绪论	第12-18页
·SMDP简介	第12-13页
·Markov决策理论的发展历史及研究现状	第13-15页
·SMDP的鲁棒控制问题	第15-16页
·本文内容和结构安排	第16-18页
第二章半Markov决策过程及其优化理论	第18-28页
·半Markov决策过程	第18-23页
·SMDP的数学模型	第18-19页
·SMDP的等价无穷小生成子和等价Markov过程	第19-22页
·SMDP的α-一致化Markov链	第22-23页
·SMDP的性能势及最优性方程	第23-26页
·SMDP的性能势	第23-24页
·基于性能势的最优性方程和最优性定理	第24-26页
·不确定SMDP的数学模型及鲁棒控制目标	第26-28页
第三章遍历链SMDP的鲁棒控制求解	第28-42页
·参数不相关的鲁棒控制求解	第28-35页
·策略迭代算法(PI)	第29页
·基于PI的鲁棒决策算法及其收敛性分析	第29-33页
·数值例子及实验结果	第33-35页
·参数相关的鲁棒控制求解	第35-41页
·遗传算法(GA)	第36-38页
·基于GA的鲁棒决策算法	第38-39页
·数值例子及实验结果	第39-41页
·本章小结	第41-42页
第四章多链SMDP的鲁棒控制求解	第42-57页
·多链SMDP的数学模型	第42-45页
·多链SMDP的性能势和最优性方程	第45-47页
·参数不相关的鲁棒控制求解	第47-50页
·多链结构下的策略迭代算法	第47-49页
·数值例子及实验结果	第49-50页
·参数相关的鲁棒控制求解	第50-56页
·并行遗传算法(PGA)	第51-52页
·基于PGA的鲁棒决策算法	第52-53页
·数值例子及实验结果	第53-56页
·本章小结	第56-57页
第五章总结与展望	第57-59页
参考文献	第59-64页
攻读硕士学位期间发表的论文	第64页