首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于多Agent强化学习的自适应服务组合研究

摘要第4-5页
Abstract第5页
本论文专用术语的注释表第8-9页
第一章 绪论第9-20页
    1.1 研究背景与动机第10-13页
        1.1.1 软件系统的自适应性第10-11页
        1.1.2 Web服务组合的自适应性第11-12页
        1.1.3 研究动机第12-13页
    1.2 国内外研究现状第13-17页
        1.2.1 自适应服务组合研究第13-15页
        1.2.2 基于多Agent技术的服务组合研究第15-16页
        1.2.3 多Agent强化学习研究第16-17页
    1.3 研究内容第17-18页
    1.4 论文结构第18-20页
第二章 Web服务组合概述第20-31页
    2.1 Web服务第20-23页
        2.1.1 Web服务定义第20-21页
        2.1.2 Web服务模型第21-22页
        2.1.3 常用Web服务标准第22-23页
    2.2 Web服务组合第23-26页
        2.2.1 Web服务组合的概念第23-24页
        2.2.2 Web服务组合的方法第24-26页
    2.3 Web服务组合的服务质量第26-28页
        2.3.1 服务质量定义第26页
        2.3.2 QoS属性第26-27页
        2.3.3 QoS抽象模型第27-28页
    2.4 Web服务组合的自适应性第28-30页
        2.4.1 Web服务组合的自适应性定义第28-29页
        2.4.2 Web服务组合的自适应性内容第29-30页
    2.5 本章小结第30-31页
第三章 强化学习理论基础第31-37页
    3.1 强化学习原理和结构第31-33页
    3.2 马尔可夫决策过程第33-34页
    3.3 强化学习常用算法第34-36页
        3.3.1 TD算法第34页
        3.3.2 Q学习算法第34-35页
        3.3.3 Sarsa算法第35-36页
    3.4 本章小结第36-37页
第四章 基于多Agent强化学习的自适应服务组合模型第37-61页
    4.1 场景描述第37页
    4.2 模型构建第37-45页
        4.2.1 基于Markov Decision Process的单Agent服务组合模型第37-40页
        4.2.2 基于Markov Games的多Agent服务组合模型第40-45页
    4.3 最优策略定义第45-50页
        4.3.1 奖励函数定义第45-48页
        4.3.2 基于Nash均衡的最优策略定义第48-50页
    4.4 协同机制设计第50-54页
        4.4.1 虚拟行动过程第50-52页
        4.4.2 协同方法设计第52-54页
    4.5 求解方法第54-56页
        4.5.1 基于离策略强化学习的求解算法第54-56页
        4.5.2 基于在策略强化学习的求解算法第56页
    4.6 方法的收敛性研究第56-59页
        4.6.1 基于离策略强化学习的求解算法的收敛性研究第56-58页
        4.6.2 基于在策略强化学习的求解算法的收敛性研究第58-59页
    4.7 本章小结第59-61页
第五章 实验与分析第61-67页
    5.1 实验设置第61-62页
    5.2 结果与分析第62-66页
        5.2.1 有效性分析第62-63页
        5.2.2 可扩展性分析第63-65页
        5.2.3 自适应性分析第65-66页
    5.3 本章小结第66-67页
第六章 总结与展望第67-71页
    6.1 本文总结第67-68页
    6.2 未来工作第68-71页
致谢第71-72页
参考文献第72-78页
附录A 攻读硕士期间发表的论文第78页

论文共78页,点击 下载论文
上一篇:大肠杆菌DsrA-sRNA和oriC转录对DNA复制起始的影响
下一篇:二倍体马铃薯DM及几个野生近缘种染色体识别和比较FISH的分析