首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于部分可观察环境下的服务组合优化方案研究

摘要第5-6页
Abstract第6页
本论文专用术语的注释表第9-10页
第一章 绪论第10-17页
    1.1 研究背景第10-11页
    1.2 研究动机第11-13页
    1.3 国内外研究现状第13-15页
    1.4 研究内容第15页
    1.5 论文结构第15-17页
第二章 Web服务及服务组合概述第17-23页
    2.1 Web服务第17-19页
        2.1.1 Web服务定义第17-18页
        2.1.2 web服务相关规范技术第18-19页
    2.2 Web服务组合第19-21页
        2.2.1 Web服务组合的概念第19-20页
        2.2.2 Web服务组合的需求第20页
        2.2.3 Web服务组合的方法第20-21页
    2.3 本章小结第21-23页
第三章 理论基础第23-32页
    3.1 部分可观察马尔可夫决策过程第23-28页
        3.1.1 基本模型第23-24页
        3.1.2 信念状态第24-25页
        3.1.3 策略与值函数第25-26页
        3.1.4 POMDP的求解第26-28页
    3.2 强化学习原理和方法第28-31页
        3.2.1 强化学习基本原理第28-29页
        3.2.2 强化学习常用算法第29-30页
        3.2.3 强化学习算法的相关问题第30-31页
    3.3 本章小结第31-32页
第四章 基于POMDP的强化学习自适应服务组合模型及优化第32-47页
    4.1 场景描述第32-33页
    4.2 模型构建第33-39页
        4.2.1 基于POMDP的服务组合模型第33-37页
        4.2.2 奖励函数定义第37-38页
        4.2.3 在策略选择第38-39页
    4.3 结合函数逼近的强化学习服务组合算法优化第39-45页
        4.3.1 SARSA(λ)算法第39-41页
        4.3.2 基于核方法的函数逼近技术第41-42页
        4.3.3 在线构造稀疏字典第42-43页
        4.3.4 基于选择性核函数的在线SARSA(λ)算法第43-45页
    4.4 本章小结第45-47页
第五章 实验与分析第47-58页
    5.1 实验设置第47-48页
    5.2 结果与分析第48-57页
        5.2.1 不同的核函数和探索策略的比较第48-49页
        5.2.2 有效性分析第49-51页
        5.2.3 可扩展性分析第51-53页
        5.2.4 自适应性分析第53-54页
        5.2.5 显著性检验第54-57页
    5.3 本章小结第57-58页
第六章 总结与展望第58-60页
    6.1 本文总结第58-59页
    6.2 未来工作第59-60页
致谢第60-61页
参考文献第61-65页
附录A 攻读硕士期间发表的论文第65页

论文共65页,点击 下载论文
上一篇:下一代防火墙中的边界流量预过滤模块设计与实现
下一篇:基于模糊测试技术的ELF漏洞检测系统设计与实现