首页--工业技术论文--建筑科学论文--建筑设计论文--一般性问题论文--设计原理、原则和管理工作论文--建筑节能设计论文

基于并行强化学习的建筑节能方法研究

摘要第6-7页
Abstract第7-8页
第一章 绪论第11-17页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-15页
        1.2.1 建筑节能控制方法的研究现状第12-13页
        1.2.2 强化学习的研究现状第13-14页
        1.2.3 并行强化学习的研究现状第14-15页
    1.3 本文的研究目的和研究内容第15-17页
第二章 强化学习理论及算法第17-27页
    2.1 强化学习第17-24页
        2.1.1 强化学习的基本要素第17-18页
        2.1.2 强化学习框架第18页
        2.1.3 马尔科夫决策过程第18-20页
        2.1.4 强化学习的主要算法第20-24页
    2.2 并行强化学习第24-25页
    2.3 函数逼近第25-26页
    2.4 本章小结第26-27页
第三章 多线程并行强化学习算法第27-41页
    3.1 相关技术第27-28页
        3.1.1 多线程技术第27-28页
        3.1.2 经验回放第28页
    3.2 多线程并行强化学习算法第28-33页
        3.2.1 MPRL的算法框架第28-29页
        3.2.2 基于FCM的强化学习多线程划分方法第29-31页
        3.2.3 MPRL算法第31-33页
    3.3 实验第33-39页
        3.3.1 Randomwalk第33-35页
        3.3.2 Windygridworld第35-38页
        3.3.3 Cartpole第38-39页
    3.4 本章小结第39-41页
第四章 一种面向建筑节能的强化学习自适应控制方法第41-52页
    4.1 强化学习自适应算法框架建模第41-43页
        4.1.1 环境建模第41-42页
        4.1.2 算法框架设计第42-43页
    4.2 控制算法与仿真步骤第43-45页
        4.2.1 控制算法第43-44页
        4.2.2 仿真步骤第44-45页
    4.3 实验第45-50页
        4.3.1 关于模型的节能性的对比实验第45页
        4.3.2 关于RLAC方法收敛性能的对比实验第45-48页
        4.3.3 关于RLAC方法对建筑物内相关设备控制性能的实验第48-50页
    4.4 本章小结第50-52页
第五章 基于并行强化学习的建筑节能方法第52-61页
    5.1 基于自模拟度量的多样性样本池第52-54页
        5.1.1 自模拟度量第52-53页
        5.1.2 多样性样本池的构造第53-54页
    5.2 基于并行强化学习的建筑节能方法第54-56页
        5.2.1 环境与强化学习信号建模第54-55页
        5.2.2 基于并行强化学习的控制节能算法第55-56页
    5.3 实验第56-59页
        5.3.1 与Q-Learning算法的对比实验第57-58页
        5.3.2 与PID控制方法的对比实验第58-59页
    5.4 本章小结第59-61页
第六章 总结第61-62页
参考文献第62-66页
图表目录第66-68页
致谢第68-69页
附录第69-71页
作者简介第71-72页

论文共72页,点击 下载论文
上一篇:基于值迭代算法的建筑能耗预测方法研究
下一篇:公共建筑照明系统动态节能方法研究