连续时间统一MAXQ算法及其应用研究

摘要	第1-6页
ABSTRACT	第6-7页
致谢	第7-10页
插图清单	第10-11页
表格清单	第11-12页
第一章绪论	第12-22页
·分层强化学习	第12-16页
·分层强化学习概述	第12-13页
·典型的分层强化学习算法	第13-16页
·多Agent 学习系统	第16-18页
·多Agent 系统概述	第16-17页
·多Agent 学习的研究现状	第17-18页
·Web 服务组合	第18-21页
·Web 服务概述	第18-19页
·Web 服务组合概述及研究现状	第19-21页
·论文研究内容及组织结构	第21-22页
第二章基本数学模型及优化算法	第22-30页
·基本数学模型	第22-24页
·半Markov 决策过程模型	第22-23页
·多Agent 半Markov 决策过程	第23-24页
·强化学习	第24-27页
·强化学习概述	第24-26页
·Q 学习优化算法	第26-27页
·MAXQ 学习算法	第27-29页
·MAXQ 算法原理	第27-28页
·MAXQ 学习优化算法	第28-29页
·本章小结	第29-30页
第三章单Agent 连续时间统一MAXQ 算法及其应用	第30-44页
·连续时间统一MAXQ 算法	第30-32页
·MAXQ 算法在Web 服务组合中的应用	第32-37页
·Web 服务组合SMDP 模型	第32-34页
·Web 服务组合的连续时间MAXQ 算法	第34-37页
·仿真实例	第37-43页
·仿真模型	第37-38页
·实验结果	第38-43页
·本章小结	第43-44页
第四章多Agent 连续时间统一MAXQ 算法及其应用	第44-55页
·多Agent 连续时间统一MAXQ 算法	第44-46页
·CMAXQ 算法在 Web 服务组合中应用	第46-49页
·多Agent Web 服务组合及其MSMDP 模型	第46-48页
·多Agent Web 服务组合的CMAXQ 算法	第48-49页
·仿真实例	第49-54页
·仿真模型	第50-51页
·实验结果	第51-54页
·本章小结	第54-55页
第五章总结	第55-56页
参考文献	第56-61页
攻读硕士期间主要科研工作和成果	第61-62页