首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于动机的强化学习及其应用研究

摘要第3-4页
Abstract第4-5页
第1章 绪论第8-12页
    1.1 引言第8-9页
    1.2 论文选题和意义第9-10页
    1.3 国内外研究现状第10-11页
    1.4 本文的组织结构第11-12页
第2章 相关工作第12-19页
    2.1 强化学习基础理论第12-15页
        2.1.1 强化学习问题模型第12-13页
        2.1.2 强化学习基本要素第13-14页
        2.1.3 强化学习算法分类第14-15页
    2.2 本文相关的强化学习算法第15-17页
        2.2.1 值迭代算法第15-16页
        2.2.2 优先扫除算法第16-17页
    2.3 强化学习中的探索策略第17-18页
        2.3.1 ε-greedy探索策略第17页
        2.3.2 Boltzmann分布探索策略第17-18页
    2.4 本章小结第18-19页
第3章 基于动机的强化学习第19-29页
    3.1 基于动机的强化学习框架第19-20页
    3.2 引入情感作为内在动机的可行性和意义第20-21页
    3.3 情感动机与传统强化学习算法的融合思路第21-23页
        3.3.1 值函数的选择第21-22页
        3.3.2 算法模型的选择第22页
        3.3.3 内外奖励的结合第22-23页
    3.4 情感动机模型的量化方案第23-28页
        3.4.1 好奇心和新奇度第25-26页
        3.4.2 控制欲和控制力第26-27页
        3.4.3 幸福指数第27-28页
    3.5 本章小结第28-29页
第4章 动机强化学习的应用第29-38页
    4.1 利用内在情感动机提高具体任务的学习效率第29-36页
        4.1.1 仿真平台第29-30页
        4.1.2 仿真场景第30-31页
        4.1.3 利用内在情感动机提前探索环境第31-33页
        4.1.4 内在情感动机与外部奖励直接结合第33-35页
        4.1.5 验证情感动机的通用性第35-36页
    4.2 利用内在情感动机实现智能体的个性化定制第36-37页
    4.3 本章小结第37-38页
第5章 总结与展望第38-40页
    5.1 本文工作总结第38页
    5.2 下一步研究方向第38-40页
参考文献第40-43页
在读期间发表的学术论文及研究成果第43-44页
致谢第44页

论文共44页,点击 下载论文
上一篇:一类欠驱动机械系统的镇定与跟踪控制研究
下一篇:基于模型检测的电子商务交易协议形式化分析与验证