不确定半马尔可夫系统最优鲁棒决策研究

第一章绪论	第1-20页
1．1 离散事件动态系统	第12-15页
1．1．1 基本概念	第12-14页
1．1．2 DEDS的研究方法	第14-15页
1．2 半 Markov决策过程和性能势	第15-17页
1．3 半 Markov决策过程鲁棒决策	第17-18页
1．4 全局优化方法	第18-20页
第二章半 Markov决策过程及基于性能势的优化算法	第20-28页
2．1 半 Markov性能势理论	第20-24页
2．1．1 半 Markov决策过程中的策略	第20-21页
2．1．2 确定性 SMDP的数学模型和性能准则	第21-22页
2．1．3 等价 Markov决策过程	第22-23页
2．1．4 SMDP性能势	第23-24页
2．2 确定性 SMDP基于性能势的优化	第24-28页
2．2．1 SMDP基于性能势的最优性方程	第24-25页
2．2．2 策略迭代算法	第25-26页
2．2．3 数值迭代算法	第26页
2．2．4 梯度算法	第26-28页
第三章全局优化算法	第28-39页
3．1 确定性全局优化	第28-32页
3．1．1 隧道函数法	第29页
3．1．2 填充函数法	第29-32页
3．2 随机性全局优化	第32-39页
3．2．1 遗传算法	第33-34页
3．2．2 模拟退火算法	第34-39页
第四章应用全局优化求解不确定 SMDP最优鲁棒策略	第39-64页
4．1 不确定 SMDP问题的描述	第39-41页
4．2 不相关参数 SMDP最优鲁棒控制策略的求解	第41-56页
4．2．1 求解算法	第41-42页
4．2．2 数值实验	第42-55页
4．2．2．1 等价无穷小生成子不确定情况	第42-46页
4．2．2．2 性能函数不确定情况	第46-49页
4．2．2．3 各情况的优化过程	第49-54页
4．2．2．4 最优鲁棒性能测度随折扣率变化的情况	第54-55页
4．2．3 实验分析	第55-56页
4．3 相关参数 SMDP最优鲁棒控制策略的求解	第56-63页
4．3．1 求解算法	第56-57页
4．3．2 数值实验	第57-62页
4．3．2．1 等价无穷小生成子不确定情况	第57-59页
4．3．2．2 性能函数不确定情况	第59-61页
4．3．2．3 最优鲁棒性能测度随折扣率变化的情况	第61-62页
4．3．3 实验分析	第62-63页
4．4 小结	第63-64页
第五章结束语	第64-66页
参考文献	第66-71页
攻读硕士学位期间主要科研工作和成果	第71页