首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

SMDP基于性能势的异步优化算法

第一章 绪论第1-21页
   ·离散事件动态系统第13-15页
   ·Markov决策过程第15-17页
     ·Markov决策过程概述第15-16页
     ·Markov决策过程和性能势第16-17页
   ·半Markov决策过程和性能势第17-19页
   ·论文组织结构第19-21页
第二章 半Markov决策过程第21-29页
   ·半Markov决策过程的分类和数学模型第21-23页
     ·半Markov决策过程的分类第21-22页
     ·半Markov决策过程的数学模型第22-23页
   ·半Markov决策过程和α-一致化Markov链第23-26页
     ·等价Markov决策过程第23-25页
     ·SMDP的α-一致化Markov链第25-26页
   ·半Markov决策过程的优化第26-29页
     ·半Markov决策过程的优化目标第26-27页
     ·半Markov决策过程的最优性方程第27-29页
第三章 SMDP基于性能势的异步数值迭代算法第29-41页
   ·SMDP基于A_α~ν的标准数值迭代第29-35页
     ·SMDP基于A_α~ν的标准数值迭代算法第30-31页
     ·收敛性证明第31-35页
   ·异步数值迭代算法第35-36页
     ·Gauss-Seidel(G-S)迭代第35页
     ·基于样本轨道的异步数值迭代第35-36页
   ·改进的数值迭代第36-37页
   ·数值例子第37-41页
第四章 SMDP基于性能势的异步策略迭代算法第41-54页
   ·TD学习和NDP优化第41-44页
     ·TD学习第41-42页
     ·神经元动态规划第42-44页
   ·基于性能势的M步向前策略迭代第44-48页
     ·M步向前异步策略迭代第44-46页
     ·基于TD学习的M步向前策略迭代第46-47页
     ·基于NDP的M步向前异步策略迭代第47-48页
   ·数值例子第48-54页
第五章 优化仿真平台第54-62页
   ·仿真平台的简介第54-55页
   ·优化算法仿真平台第55-59页
   ·总结与展望第59-62页
第六章 总结第62-63页
参考文献第63-68页
攻读硕士学位期间主要科研工作和成果第68页

论文共68页,点击 下载论文
上一篇:等离子割炬的设计
下一篇:保水剂的保肥性能研究