摘要 | 第1-4页 |
Abstract | 第4-8页 |
1 绪论 | 第8-13页 |
·研究背景及意义 | 第8-9页 |
·国内外研究现状 | 第9-11页 |
·机器人发展与研究现状 | 第9-10页 |
·机器人领域强化学习的研究现状 | 第10-11页 |
·研究出发点与任务 | 第11页 |
·本文的主要工作 | 第11-13页 |
2 尖峰神经元模型的选择及强化学习相关知识 | 第13-25页 |
·神经元相关知识 | 第13-14页 |
·强化学习相关知识 | 第14-16页 |
·神经元模型 | 第16-17页 |
·神经元模型的发展 | 第16页 |
·神经元模型的相关介绍 | 第16-17页 |
·单神经元模型的比较 | 第17-22页 |
·第二代与第三代单神经元模型的仿真比较 | 第17-18页 |
·几种代表性的尖峰神经元模型的比较 | 第18-22页 |
·多神经元模型的比较 | 第22-24页 |
·本章小结 | 第24-25页 |
3 尖峰神经元模型的仿真研究及时空整合 | 第25-36页 |
·Izhikevich模型 | 第25-30页 |
·概述 | 第25页 |
·尖峰神经元动力学描述及仿真研究 | 第25-30页 |
·模型各个参数的作用 | 第30页 |
·神经元时间和空间上的叠加 | 第30-33页 |
·空间上的叠加 | 第31-32页 |
·时间上的叠加 | 第32-33页 |
·突触前神经元数目的变化对突触后神经元的影响 | 第33-35页 |
·本章小结 | 第35-36页 |
4 基于多巴胺调节特性的学习能力研究 | 第36-48页 |
·突触的相关介绍 | 第36-37页 |
·突触的基本简介 | 第36页 |
·突触可塑性研究 | 第36-37页 |
·多巴胺概述与条件反射 | 第37-38页 |
·基于多巴胺的突触可塑性研究 | 第38-43页 |
·多巴胺调节的LTP | 第38-42页 |
·多巴胺调节的LTD | 第42-43页 |
·多巴胺延时释放时间对突触强度的影响 | 第43-47页 |
·基于LTP过程多巴胺延时时间变化时突触强度的变化 | 第43-45页 |
·基于LTD过程多巴胺延时时间变化时突触强度的变化 | 第45-47页 |
·本章小结 | 第47-48页 |
5 基于尖峰神经元模型强化学习思想在机器人中的应用 | 第48-59页 |
·仿真平台的介绍 | 第48页 |
·仿真设计 | 第48-54页 |
·仿真过程的基本思路设计 | 第48-50页 |
·仿真程序设计 | 第50-52页 |
·仿真环境的构造 | 第52-54页 |
·三路口迷宫仿真 | 第54-58页 |
·仿真设置 | 第54-55页 |
·结果与分析 | 第55-58页 |
·本章小结 | 第58-59页 |
6 迷宫结构及模型参数对机器人学习能力影响的研究 | 第59-73页 |
·迷宫复杂度变化时机器人的学习能力研究 | 第59-61页 |
·奖励延时时间变化时机器人学习能力的变化 | 第61-65页 |
·神经元数目变化对机器人学习能力的影响 | 第65-72页 |
·控制器神经元数目对机器人学习能力的影响 | 第65-68页 |
·传感器神经元数目变化对机器人学习能力的影响 | 第68-72页 |
·本章小结 | 第72-73页 |
7 结论与展望 | 第73-75页 |
·本文的主要工作 | 第73页 |
·展望 | 第73-75页 |
致谢 | 第75-76页 |
参考文献 | 第76-78页 |