首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

基于Q学习的传感器节点任务调度算法研究

致谢第7-8页
摘要第8-9页
ABSTRACT第9-10页
第一章 绪论第15-21页
    1.1 课题背景第15-16页
    1.2 基本概念第16-18页
        1.2.1 WSN概述第16-17页
        1.2.2 WSN任务调度概述第17-18页
    1.3 国内外研究现状第18-20页
    1.4 论文组织安排第20-21页
第二章 相关理论和仿真工具第21-30页
    2.1 强化学习基本概念第21-24页
        2.1.1 强化学习原理第21-22页
        2.1.2 马尔可夫决策过程第22-24页
    2.2 强化学习常见算法第24-27页
        2.2.1 时间差分方法第24-25页
        2.2.2 Q学习和SARSA学习第25-26页
        2.2.3 Dyna规划过程第26-27页
    2.3 模拟退火方法第27-28页
    2.4 NS3网络仿真工具第28-29页
    2.5 本章小结第29-30页
第三章 传感器节点任务调度问题及框架研究第30-39页
    3.1 问题描述第30-33页
        3.1.1 框架映射第30-31页
        3.1.2 问题求解第31-33页
    3.2 任务调度算法框架第33-36页
        3.2.1 基本学习元素第33-34页
        3.2.2 ε-greedy方法第34页
        3.2.3 算法描述和分析第34-36页
    3.3 学习算法及适用场景分析第36-38页
        3.3.1 独立学习和合作学习第36-37页
        3.3.2 适用场景分析第37-38页
    3.4 本章小结第38-39页
第四章 基于Q学习和规划的独立型任务调度算法第39-50页
    4.1 模型建立第39-41页
        4.1.1 数据收集任务模型第39页
        4.1.2 独立Q学习模型第39-41页
    4.2 独立型任务调度算法第41-45页
        4.2.1 基本学习元素第41-42页
        4.2.2 动态探索和利用策略第42-43页
        4.2.3 规划过程第43-44页
        4.2.4 算法描述和分析第44-45页
    4.3 仿真分析第45-49页
        4.3.1 QP下任务调度动态性分析第46-47页
        4.3.2 各算法性能对比第47-48页
        4.3.3 QP和IQ的性能变化对比第48-49页
    4.4 本章小结第49-50页
第五章 基于Q学习和共享值函数的合作型任务调度算法第50-62页
    5.1 模型建立第50-52页
        5.1.1 移动目标监测任务模型第50-51页
        5.1.2 合作Q学习模型第51-52页
    5.2 合作型任务调度算法第52-57页
        5.2.1 基本学习元素第52-53页
        5.2.2 模拟退火策略第53页
        5.2.3 发送约束和过期约束第53-55页
        5.2.4 初始环境和稳定环境下QS分析第55-57页
        5.2.5 算法描述和分析第57页
    5.3 仿真分析第57-61页
        5.3.1 QS下任务调度动态性分析第58-59页
        5.3.2 各算法性能对比第59-60页
        5.3.3 QS和CQ的性能变化对比第60-61页
    5.4 本章小结第61-62页
第六章 总结和展望第62-64页
    6.1 总结第62页
    6.2 展望第62-64页
参考文献第64-68页
攻读硕士学位期间的学术活动及成果情况第68-69页

论文共69页,点击 下载论文
上一篇:压缩感知中二进制测量矩阵的构造与优化
下一篇:工业嵌入式设备软件无线升级技术的研究与实现