基于奖励调制的决策计算神经模型
摘要 | 第1-5页 |
Abstract | 第5-11页 |
第1章 绪论 | 第11-21页 |
·研究背景与意义 | 第11-12页 |
·相关研究 | 第12-17页 |
·由感知刺激产生的决策 | 第12-14页 |
·基于主观值计算的决策 | 第14-15页 |
·需要工作记忆的感知决策 | 第15-17页 |
·问题的提出 | 第17-18页 |
·论文的主要工作与章节安排 | 第18-21页 |
第2章 满足匹配律的策略参数搜索决策模型 | 第21-44页 |
·引言 | 第21-22页 |
·奖励方案与匹配律 | 第22-24页 |
·奖励方案 | 第22-23页 |
·匹配律 | 第23-24页 |
·基于策略参数的策略搜索模型 | 第24-29页 |
·决策的策略搜索模型 | 第24-26页 |
·满足匹配律的策略 | 第26-29页 |
·策略的正确性验证 | 第29-39页 |
·证明 | 第29-30页 |
·数值仿真 | 第30-33页 |
·模拟行为学实验 | 第33-36页 |
·性能分析 | 第36-39页 |
·讨论 | 第39-42页 |
·匹配律的行为机制 | 第39-40页 |
·与已有模型的比较 | 第40-41页 |
·策略模型可能的神经机制 | 第41-42页 |
·本章小结 | 第42-44页 |
第3章 基于对数似然比计算的决策模型 | 第44-69页 |
·引言 | 第44-45页 |
·基于对数似然比的决策 | 第45-46页 |
·基于胜者独享和奖励调制突触可塑性的决策模型 | 第46-53页 |
·决策模型的结构 | 第46-48页 |
·决策回路的动力学 | 第48-52页 |
·奖励调制的突触可塑性 | 第52-53页 |
·输入突触与决策行为之间的关系 | 第53-59页 |
·仿真结果 | 第53-55页 |
·证明 | 第55-59页 |
·决策模型的特性 | 第59-65页 |
·突触的动态变化编码获奖概率 | 第59-60页 |
·实现基于对数似然比的决策 | 第60-61页 |
·模拟行为学实验结果 | 第61-65页 |
·讨论 | 第65-68页 |
·奖励调制突触可塑性的实验与理论依据 | 第65-66页 |
·与已有模型的比较 | 第66-68页 |
·本章小结 | 第68-69页 |
第4章 时延感知区分决策的计算神经模型 | 第69-94页 |
·引言 | 第69-70页 |
·具有时延的感知区分任务 | 第70-73页 |
·决策任务 | 第70-71页 |
·行为和神经生理学实验结果 | 第71-73页 |
·基于稀疏编码与奖励调制突触可塑性的决策模型 | 第73-76页 |
·决策模型的结构 | 第73-76页 |
·奖励调制的突触可塑性 | 第76页 |
·结果 | 第76-85页 |
·决策模型的行为学结果 | 第76-77页 |
·决策神经元的发放特征 | 第77-78页 |
·工作记忆期间的响应 | 第78-82页 |
·神经元的异质性响应 | 第82-85页 |
·模型性能及动力学特性分析 | 第85-90页 |
·模型的性能分析 | 第85-86页 |
·神经元活性的主成分分析 | 第86-87页 |
·神经元群体活性的相关性分析 | 第87-90页 |
·讨论 | 第90-92页 |
·与已有模型的比较 | 第90-91页 |
·网络的动力学特性与认知计算 | 第91-92页 |
·高级皮层神经元的稀疏编码 | 第92页 |
·本章小结 | 第92-94页 |
第5章 结束语 | 第94-98页 |
·结论 | 第94-96页 |
·待研究的问题 | 第96-98页 |
参考文献 | 第98-106页 |
致谢 | 第106-108页 |
附录 A CVI 奖励方案下的匹配与优化行为 | 第108-111页 |
附录 B 根据优化策略推导的匹配策略 | 第111-115页 |
个人简历、在学期间发表的学术论文与研究成果 | 第115-116页 |