基于奖励调制的决策计算神经模型
| 摘要 | 第1-5页 |
| Abstract | 第5-11页 |
| 第1章 绪论 | 第11-21页 |
| ·研究背景与意义 | 第11-12页 |
| ·相关研究 | 第12-17页 |
| ·由感知刺激产生的决策 | 第12-14页 |
| ·基于主观值计算的决策 | 第14-15页 |
| ·需要工作记忆的感知决策 | 第15-17页 |
| ·问题的提出 | 第17-18页 |
| ·论文的主要工作与章节安排 | 第18-21页 |
| 第2章 满足匹配律的策略参数搜索决策模型 | 第21-44页 |
| ·引言 | 第21-22页 |
| ·奖励方案与匹配律 | 第22-24页 |
| ·奖励方案 | 第22-23页 |
| ·匹配律 | 第23-24页 |
| ·基于策略参数的策略搜索模型 | 第24-29页 |
| ·决策的策略搜索模型 | 第24-26页 |
| ·满足匹配律的策略 | 第26-29页 |
| ·策略的正确性验证 | 第29-39页 |
| ·证明 | 第29-30页 |
| ·数值仿真 | 第30-33页 |
| ·模拟行为学实验 | 第33-36页 |
| ·性能分析 | 第36-39页 |
| ·讨论 | 第39-42页 |
| ·匹配律的行为机制 | 第39-40页 |
| ·与已有模型的比较 | 第40-41页 |
| ·策略模型可能的神经机制 | 第41-42页 |
| ·本章小结 | 第42-44页 |
| 第3章 基于对数似然比计算的决策模型 | 第44-69页 |
| ·引言 | 第44-45页 |
| ·基于对数似然比的决策 | 第45-46页 |
| ·基于胜者独享和奖励调制突触可塑性的决策模型 | 第46-53页 |
| ·决策模型的结构 | 第46-48页 |
| ·决策回路的动力学 | 第48-52页 |
| ·奖励调制的突触可塑性 | 第52-53页 |
| ·输入突触与决策行为之间的关系 | 第53-59页 |
| ·仿真结果 | 第53-55页 |
| ·证明 | 第55-59页 |
| ·决策模型的特性 | 第59-65页 |
| ·突触的动态变化编码获奖概率 | 第59-60页 |
| ·实现基于对数似然比的决策 | 第60-61页 |
| ·模拟行为学实验结果 | 第61-65页 |
| ·讨论 | 第65-68页 |
| ·奖励调制突触可塑性的实验与理论依据 | 第65-66页 |
| ·与已有模型的比较 | 第66-68页 |
| ·本章小结 | 第68-69页 |
| 第4章 时延感知区分决策的计算神经模型 | 第69-94页 |
| ·引言 | 第69-70页 |
| ·具有时延的感知区分任务 | 第70-73页 |
| ·决策任务 | 第70-71页 |
| ·行为和神经生理学实验结果 | 第71-73页 |
| ·基于稀疏编码与奖励调制突触可塑性的决策模型 | 第73-76页 |
| ·决策模型的结构 | 第73-76页 |
| ·奖励调制的突触可塑性 | 第76页 |
| ·结果 | 第76-85页 |
| ·决策模型的行为学结果 | 第76-77页 |
| ·决策神经元的发放特征 | 第77-78页 |
| ·工作记忆期间的响应 | 第78-82页 |
| ·神经元的异质性响应 | 第82-85页 |
| ·模型性能及动力学特性分析 | 第85-90页 |
| ·模型的性能分析 | 第85-86页 |
| ·神经元活性的主成分分析 | 第86-87页 |
| ·神经元群体活性的相关性分析 | 第87-90页 |
| ·讨论 | 第90-92页 |
| ·与已有模型的比较 | 第90-91页 |
| ·网络的动力学特性与认知计算 | 第91-92页 |
| ·高级皮层神经元的稀疏编码 | 第92页 |
| ·本章小结 | 第92-94页 |
| 第5章 结束语 | 第94-98页 |
| ·结论 | 第94-96页 |
| ·待研究的问题 | 第96-98页 |
| 参考文献 | 第98-106页 |
| 致谢 | 第106-108页 |
| 附录 A CVI 奖励方案下的匹配与优化行为 | 第108-111页 |
| 附录 B 根据优化策略推导的匹配策略 | 第111-115页 |
| 个人简历、在学期间发表的学术论文与研究成果 | 第115-116页 |