首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

连续时间统一MAXQ算法及其应用研究

摘要第1-6页
ABSTRACT第6-7页
致谢第7-10页
插图清单第10-11页
表格清单第11-12页
第一章 绪论第12-22页
   ·分层强化学习第12-16页
     ·分层强化学习概述第12-13页
     ·典型的分层强化学习算法第13-16页
   ·多Agent 学习系统第16-18页
     ·多Agent 系统概述第16-17页
     ·多Agent 学习的研究现状第17-18页
   ·Web 服务组合第18-21页
     ·Web 服务概述第18-19页
     ·Web 服务组合概述及研究现状第19-21页
   ·论文研究内容及组织结构第21-22页
第二章 基本数学模型及优化算法第22-30页
   ·基本数学模型第22-24页
     ·半Markov 决策过程模型第22-23页
     ·多Agent 半Markov 决策过程第23-24页
   ·强化学习第24-27页
     ·强化学习概述第24-26页
     ·Q 学习优化算法第26-27页
   ·MAXQ 学习算法第27-29页
     ·MAXQ 算法原理第27-28页
     ·MAXQ 学习优化算法第28-29页
   ·本章小结第29-30页
第三章 单Agent 连续时间统一MAXQ 算法及其应用第30-44页
   ·连续时间统一MAXQ 算法第30-32页
   ·MAXQ 算法在Web 服务组合中的应用第32-37页
     ·Web 服务组合SMDP 模型第32-34页
     ·Web 服务组合的连续时间MAXQ 算法第34-37页
   ·仿真实例第37-43页
     ·仿真模型第37-38页
     ·实验结果第38-43页
   ·本章小结第43-44页
第四章 多Agent 连续时间统一MAXQ 算法及其应用第44-55页
   ·多Agent 连续时间统一MAXQ 算法第44-46页
   ·CMAXQ 算法在 Web 服务组合中应用第46-49页
     ·多Agent Web 服务组合及其MSMDP 模型第46-48页
     ·多Agent Web 服务组合的CMAXQ 算法第48-49页
   ·仿真实例第49-54页
     ·仿真模型第50-51页
     ·实验结果第51-54页
   ·本章小结第54-55页
第五章 总结第55-56页
参考文献第56-61页
攻读硕士期间主要科研工作和成果第61-62页

论文共62页,点击 下载论文
上一篇:皮带机群控系统的Petri网建模与规则化描述
下一篇:一种仿生大气偏振信息传感阵列研究