首页--工业技术论文--无线电电子学、电信技术论文--无线通信论文--移动通信论文

基于强化学习的蜂窝网频谱规划和D2D系统资源管理

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第13-17页
    1.1 引言第13-14页
    1.2 论文研究背景第14-16页
        1.2.1 无线资源管理概述第14-15页
        1.2.2 强化学习概述及研究现状第15-16页
    1.3 本文内容的结构安排第16-17页
第二章 强化学习理论基础第17-27页
    2.1 强化学习概述第17-21页
        2.1.1 强化学习模型第17-20页
        2.1.2 马尔科夫决策过程第20-21页
    2.2 强化学习算法第21-26页
        2.2.1 TD算法第22-23页
        2.2.2 Q学习算法第23-24页
        2.2.3 Sarsa学习算法第24-25页
        2.2.4 Dyna学习算法第25页
        2.2.5 多Agent强化学习第25-26页
    2.3 本章总结第26-27页
第三章 基于强化学习的部分频率复用方法改进第27-48页
    3.1 频率复用及部分频率复用第27-32页
        3.1.1 蜂窝和频率复用第27-30页
        3.1.2 部分频率复用概述第30-32页
    3.2 联结强化学习第32-34页
        3.2.1 强化学习联结网络第32页
        3.2.3 梯度强化学习算法第32-34页
    3.3 基于梯度强化学习算法的部分频率复用第34-40页
        3.3.1 系统模型第34-36页
        3.3.2 问题映射第36-38页
        3.3.3 算法描述第38-40页
    3.4 仿真与分析第40-47页
        3.4.1 仿真参数说明第40-43页
        3.4.2 仿真结果及分析第43-47页
    3.5 本章小结第47-48页
第四章 基于Q学习的D2D无线资源管理第48-70页
    4.1 D2D技术第48-50页
    4.2 采用D2D技术的蜂窝网络系统第50-55页
        4.2.1 D2D蜂窝通信系统建模第50-51页
        4.2.2 D2D通信系统无线资源管理第51-55页
    4.3 基于强化学习的D2D资源分配第55-69页
        4.3.1 基于Q学习的Overlay模式下的信道分配第55-64页
        4.3.2 基于Q学习的Underlay模式下的信道和功率分配第64-69页
    4.4 本章小结第69-70页
第五章 总结及展望第70-72页
    5.1 本文工作及贡献第70页
    5.2 下一步工作计划第70-72页
致谢第72-73页
参考文献第73-77页
攻读硕士期间取得的研究成果第77-78页
个人简历第78-79页

论文共79页,点击 下载论文
上一篇:跳频信号参数估计与调制识别
下一篇:高动态高空平台网络接入与切换技术研究及仿真