首页--工业技术论文--无线电电子学、电信技术论文--无线通信论文--无线电中继通信、微波通信论文

基于强化学习的动态频谱分配算法的研究

摘要第1-5页
Abstract第5-6页
缩略语第6-9页
第一章 绪论第9-16页
   ·引言第9页
   ·论文研究背景第9-14页
     ·认知无线电及强化学习概述第9-12页
     ·认知无线电及强化学习发展现状第12-14页
   ·本文的组织结构第14-16页
第二章 强化学习的理论基础第16-30页
   ·强化学习概述第16-21页
     ·强化学习模型第16-18页
     ·优化行为模型第18-19页
     ·马尔可夫决策过程第19-21页
   ·强化学习的基本算法第21-26页
     ·TD算法第22-23页
     ·Q学习第23-25页
     ·Sarsa学习算法第25-26页
     ·Dyna算法第26页
   ·多Agent强化学习基本理论第26-29页
     ·MARL方法及其发展第27页
     ·合作MARL第27-28页
     ·基于对策或平衡解的MARL第28-29页
     ·最佳响应MARL第29页
   ·本章小结第29-30页
第三章 基于DAQL动态频谱接入改进算法第30-42页
   ·引言第30页
   ·认知引擎第30-32页
   ·改进的DAQL算法第32-37页
     ·系统模型第32-33页
     ·接入方案第33页
     ·算法描述第33-34页
     ·问题映射第34-35页
     ·DAQL改进算法实现过程第35-37页
   ·仿真与分析第37-41页
     ·只有固定占用频谱的授权用户存在时的接入分析第38-39页
     ·有多种授权用户存在时的接入分析第39-41页
   ·本章小结第41-42页
第四章 基于分布式独立学习的多用户动态频谱接入算法第42-53页
   ·引言第42-43页
   ·多Agent系统第43-44页
   ·基于分布式独立学习的多用户动态频谱接入算法第44-49页
     ·系统环境模型第44-45页
     ·分布式独立强化学习第45-46页
     ·问题映射及实现过程第46-49页
   ·仿真与分析第49-52页
   ·本章小结第52-53页
第五章 基于协作学习的多用户动态频谱接入算法第53-63页
   ·引言第53页
   ·多Agent系统的协作机制第53-55页
     ·合同网技术第53-54页
     ·黑板模型第54页
     ·结果共享的协同方法第54-55页
   ·基于协作学习的多用户动态频谱接入算法第55-60页
     ·算法框架第55-56页
     ·算法描述第56-60页
   ·仿真结果及其分析第60-61页
   ·本章小结第61-63页
第六章 全文总结及展望第63-65页
   ·本文工作总结第63页
   ·进一步研究展望第63-65页
致谢第65-66页
参考文献第66-70页
攻读硕士期间发表的论文及参加的项目第70页

论文共70页,点击 下载论文
上一篇:认知Ad Hoc网络中路由技术研究
下一篇:基于频谱感知的MAC层参数优化的研究