首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于深度强化学习的流媒体边缘云会话调度策略

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第11-21页
    1.1 研究背景及意义第11-15页
        1.1.1 传统流媒体服务系统及其局限性第11-12页
        1.1.2 流媒体云概念第12-13页
        1.1.3 流媒体边缘云架构第13-15页
    1.2 研究现状第15-18页
        1.2.1 流媒体服务系统资源调度研究现状第15-16页
        1.2.2 会话迁移研究现状第16-17页
        1.2.3 强化学习研究现状及其在调度中的应用第17-18页
        1.2.4 研究现状总结第18页
    1.3 本文主要研究工作第18-19页
    1.4 论文组织结构第19-21页
第2章 强化学习方法简介第21-31页
    2.1 强化学习及其理论基础第21-24页
        2.1.1 马尔可夫决策过程模型第21-22页
        2.1.2 强化学习的原理及模型第22-23页
        2.1.3 强化学习的组成要素第23-24页
    2.2 强化学习的常用算法第24-30页
        2.2.1 时序差分算法第24-25页
        2.2.2 Q学习算法第25-26页
        2.2.3 Sarsa算法第26-27页
        2.2.4 Actor-Critic算法第27-30页
    2.3 本章小结第30-31页
第3章 流媒体边缘云会话调度问题第31-43页
    3.1 问题描述第31-32页
    3.2 统一调度模型第32-33页
    3.3 传统的会话调度方法第33-37页
    3.4 会话调度整体流程第37-40页
        3.4.1 基于传统调度方法的会话调度整体流程第37-38页
        3.4.2 基于深度强化学习方法的会话调度整体流程第38-40页
    3.5 单时刻的会话调度过程第40-42页
    3.6 本章小结第42-43页
第4章 基于深度强化学习的会话调度策略第43-57页
    4.1 会话调度模型第43-44页
    4.2 会话调度的强化学习模型第44-49页
        4.2.1 状态空间和输入第45-46页
        4.2.2 动作集合和输出第46-47页
        4.2.3 即时回报第47-48页
        4.2.4 动作-价值函数第48-49页
    4.3 基于强化学习的会话调度算法第49-55页
        4.3.1 确定性策略方法第49-50页
        4.3.2 行为选择策略第50-52页
        4.3.3 动作-价值函数的存储与泛化第52-54页
        4.3.4 调度算法第54-55页
    4.4 本章小结第55-57页
第5章 仿真实验及分析第57-71页
    5.1 基于确定性策略梯度的深度强化学习算法实现第57-61页
        5.1.1 实验平台的搭建第57-58页
        5.1.2 算法参数的设计第58-59页
        5.1.3 算法训练流程第59-61页
    5.2 流媒体边缘云会话调度仿真实验第61-68页
        5.2.1 请求接入仿真流程第61-62页
        5.2.2 仿真参数设置及其合理性说明第62-63页
        5.2.3 仿真实验结果与分析第63-68页
    5.3 本章小结第68-71页
第6章 总结与展望第71-73页
    6.1 工作总结第71-72页
    6.2 未来展望第72-73页
参考文献第73-77页
致谢第77-79页
在读期间发表的学术论文与取得的其他研究成果第79页

论文共79页,点击 下载论文
上一篇:二阶SQL注入技术和检测方法研究
下一篇:基于软资源配置和混合负载建模的多层Web应用性能分析与优化研究