首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

大规模Markov决策过程基于性能势的并行算法研究与应用

摘要第1-7页
ABSTRACT第7-9页
致谢第9-14页
第一章 绪论第14-23页
   ·DEDS、MDP与性能势理论第14-16页
   ·并行计算概括第16-20页
     ·并行计算机分类第16-18页
     ·并行编程语言和环境第18-19页
     ·并行算法设计过程第19-20页
     ·并行算法的性能评价第20页
   ·MDP串行和并行算法的研究现状第20-21页
   ·论文的主要工作第21-23页
第二章 MDP优化基本理论第23-30页
   ·MDP数学模型第23-24页
   ·MDP优化方法第24-30页
     ·基于理论计算的优化方法第25-26页
     ·基于强化学习的仿真优化方法第26-28页
     ·基于NDP的仿真优化算法第28-30页
第三章 并行数值迭代算法第30-40页
   ·引言第30页
   ·并行数值迭代算法的基本框架第30-31页
   ·划分策略第31-33页
     ·模型建立第31-32页
     ·启发式划分策略第32-33页
     ·性能分析第33页
   ·数值例子第33-39页
   ·本章小结第39-40页
第四章 并行仿真优化方法第40-59页
   ·并行Q学习算法第40-50页
     ·Q学习算法第41页
     ·基于并行思想的Q学习算法改进第41-44页
     ·算法中主要参数设计第44-45页
       ·同步策略第44-45页
       ·Q值构建策略第45页
     ·数值例子第45-50页
   ·并行NDP优化算法第50-58页
     ·Critic模式下NDP优化方法第50-52页
       ·性能势TD学习算法第50-51页
       ·NDP优化算法第51-52页
     ·基于神经网络集成的NDP并行优化第52-54页
       ·神经网络集成第52页
       ·NDP并行优化方法第52-54页
     ·数值例子第54-58页
   ·本章小结第58-59页
第五章 在线Rollout仿真算法及并行实现第59-70页
   ·引言第59页
   ·Rollout及其并行求解算法第59-61页
   ·Rollout算法在多类商品库存控制中的应用第61-66页
     ·基本假设第61页
     ·数学符号第61-62页
     ·多类商品库存控制的MDP数学模型第62-63页
     ·数值例子第63-66页
   ·Rollout算法在多级仓库库存控制中的应用第66-69页
     ·多agent学习研究概况第66-67页
     ·多agent MDP数学模型第67页
     ·多agent Rollout学习算法第67-68页
     ·多级仓库最优库存控制实例第68-69页
   ·本章小结第69-70页
第六章 总结与展望第70-72页
   ·总结第70-71页
   ·展望第71-72页
参考文献第72-77页
攻读硕士学位期间主要科研工作和成果第77页

论文共77页,点击 下载论文
上一篇:跨国企业薪酬体系设计研究
下一篇:中国家族式民营企业治理结构