首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

不确定半马尔可夫系统最优鲁棒决策研究

第一章 绪论第1-20页
 1.1 离散事件动态系统第12-15页
  1.1.1 基本概念第12-14页
  1.1.2 DEDS的研究方法第14-15页
 1.2 半 Markov决策过程和性能势第15-17页
 1.3 半 Markov决策过程鲁棒决策第17-18页
 1.4 全局优化方法第18-20页
第二章 半 Markov决策过程及基于性能势的优化算法第20-28页
 2.1 半 Markov性能势理论第20-24页
  2.1.1 半 Markov决策过程中的策略第20-21页
  2.1.2 确定性 SMDP的数学模型和性能准则第21-22页
  2.1.3 等价 Markov决策过程第22-23页
  2.1.4 SMDP性能势第23-24页
 2.2 确定性 SMDP基于性能势的优化第24-28页
  2.2.1 SMDP基于性能势的最优性方程第24-25页
  2.2.2 策略迭代算法第25-26页
  2.2.3 数值迭代算法第26页
  2.2.4 梯度算法第26-28页
第三章 全局优化算法第28-39页
 3.1 确定性全局优化第28-32页
  3.1.1 隧道函数法第29页
  3.1.2 填充函数法第29-32页
 3.2 随机性全局优化第32-39页
  3.2.1 遗传算法第33-34页
  3.2.2 模拟退火算法第34-39页
第四章 应用全局优化求解不确定 SMDP最优鲁棒策略第39-64页
 4.1 不确定 SMDP问题的描述第39-41页
 4.2 不相关参数 SMDP最优鲁棒控制策略的求解第41-56页
  4.2.1 求解算法第41-42页
  4.2.2 数值实验第42-55页
   4.2.2.1 等价无穷小生成子不确定情况第42-46页
   4.2.2.2 性能函数不确定情况第46-49页
   4.2.2.3 各情况的优化过程第49-54页
   4.2.2.4 最优鲁棒性能测度随折扣率变化的情况第54-55页
  4.2.3 实验分析第55-56页
 4.3 相关参数 SMDP最优鲁棒控制策略的求解第56-63页
  4.3.1 求解算法第56-57页
  4.3.2 数值实验第57-62页
   4.3.2.1 等价无穷小生成子不确定情况第57-59页
   4.3.2.2 性能函数不确定情况第59-61页
   4.3.2.3 最优鲁棒性能测度随折扣率变化的情况第61-62页
  4.3.3 实验分析第62-63页
 4.4 小结第63-64页
第五章 结束语第64-66页
参考文献第66-71页
攻读硕士学位期间主要科研工作和成果第71页

论文共71页,点击 下载论文
上一篇:WCDMA系统覆盖与容量分析
下一篇:我国政府部门人力资源管理研究