首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

应用于感知决策任务的策略算法研究

摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第14-23页
    1.1 研究背景和意义第14-16页
    1.2 国内外研究现状第16-20页
    1.3 论文研究内容第20-21页
    1.4 论文组织结构第21-23页
第二章 强化学习用于决策建模的理论基础第23-35页
    2.1 引言第23页
    2.2 决策过程建模第23-24页
    2.3 决策过程中的强化学习算法第24-30页
        2.3.1 TD学习第24-27页
        2.3.2 Q学习与SARSA学习第27-29页
        2.3.3 策略梯度算法第29-30页
    2.4 大脑执行强化学习的过程第30-34页
    2.5 小结第34-35页
第三章 基于外部奖励的单阶段感知决策任务与策略算法第35-59页
    3.1 引言第35-36页
    3.2 基于PyQt的单阶段感知决策任务设计与实现第36-43页
        3.2.1 单阶段感知决策任务功能设计第36-39页
        3.2.2 单阶段感知决策任务开发与实现第39-42页
        3.2.3 实验流程第42-43页
    3.3 基于外部奖励的策略算法第43-48页
    3.4 行为数据的统计分析第48-50页
    3.5 基于外部奖励的策略模型与行为数据对比分析第50-57页
    3.6 讨论与结论第57-59页
第四章 结合内外部奖励的双阶段感知决策任务与策略算法第59-85页
    4.1 引言第59页
    4.2 基于PsychoPy的双阶段感知决策任务设计与实现第59-67页
        4.2.1 双阶段感知决策任务功能设计第59-63页
        4.2.2 双阶段感知决策任务开发与实现第63-65页
        4.2.3 实验流程第65-67页
    4.3 结合内外部奖励的策略算法第67-70页
    4.4 行为数据的统计分析第70-74页
    4.5 结合内外部奖励的策略模型与行为数据对比分析第74-82页
    4.6 讨论与结论第82-85页
第五章 结论与展望第85-87页
    5.1 结论第85-86页
    5.2 展望第86-87页
参考文献第87-92页
附录第92-98页
致谢第98-100页
作者简介第100-102页
    1 作者简历第100页
    2 攻读硕士学位期间发表的学术论文第100页
    3 发明专利第100-102页
学位论文数据集第102页

论文共102页,点击 下载论文
上一篇:EG公司物流外包及供应商库存管理研究
下一篇:杜氏盐藻(Dunaliella salina)MAR序列结合蛋白基因cDNA全长的克隆及序列分析