首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于搜索熵的强化学习搜索策略分析及算法研究

摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第11-18页
    1.1 研究背景和意义第11-12页
    1.2 国内外研究现状及分析第12-16页
        1.2.1 强化学习的研究现状及分析第12-15页
        1.2.2 搜索策略的研究现状及分析第15-16页
    1.3 论文的结构安排第16-18页
第二章 强化学习第18-28页
    2.1 强化学习的理论基础第18-23页
        2.1.1 马尔可夫决策过程第19-20页
        2.1.2 强化学习的模型第20-23页
    2.2 强化学习中的经典算法第23-27页
        2.2.1 瞬时差分算法第24-25页
        2.2.2 Q-Learning算法第25-27页
    2.3 本章小结第27-28页
第三章 搜索熵第28-46页
    3.1 搜索策略第28-34页
        3.1.1 搜索与利用的平衡第28-30页
        3.1.2 典型搜索策略第30-34页
    3.2 搜索熵第34-40页
        3.2.1 熵:从热力学到信息学的物理量第34-37页
        3.2.2 搜索熵定义及性质第37-40页
    3.3 搜索熵在算法分析中的应用第40-44页
    3.4 本章小结第44-46页
第四章 仿真实验第46-67页
    4.1 实验一:马尔可夫状态转移问题第46-56页
        4.1.1 盲贪心策略第48-49页
        4.1.2 贪心策略第49-51页
        4.1.3 混合贪心策略第51-52页
        4.1.4 Softmax方法第52-54页
        4.1.5 概率分布动作选择机制第54-56页
    4.2 实验二:自旋量子系统的学习控制问题第56-65页
        4.2.1 盲搜索策略第58-59页
        4.2.2 贪心策略第59-61页
        4.2.3 混合贪心策略第61-63页
        4.2.4 概率分布动作选择机制第63-65页
    4.3 实验结论第65-67页
第五章 总结与展望第67-69页
    5.1 总结第67-68页
    5.2 展望第68-69页
致谢第69-70页
参考文献第70-73页

论文共73页,点击 下载论文
上一篇:花山岩画艺术发生学研究
下一篇:莫里斯·布朗肖“沉默”文学叙事理论研究