| 摘要 | 第1-4页 |
| Abstract | 第4-8页 |
| 1 绪论 | 第8-13页 |
| ·研究背景及意义 | 第8-9页 |
| ·国内外研究现状 | 第9-11页 |
| ·机器人发展与研究现状 | 第9-10页 |
| ·机器人领域强化学习的研究现状 | 第10-11页 |
| ·研究出发点与任务 | 第11页 |
| ·本文的主要工作 | 第11-13页 |
| 2 尖峰神经元模型的选择及强化学习相关知识 | 第13-25页 |
| ·神经元相关知识 | 第13-14页 |
| ·强化学习相关知识 | 第14-16页 |
| ·神经元模型 | 第16-17页 |
| ·神经元模型的发展 | 第16页 |
| ·神经元模型的相关介绍 | 第16-17页 |
| ·单神经元模型的比较 | 第17-22页 |
| ·第二代与第三代单神经元模型的仿真比较 | 第17-18页 |
| ·几种代表性的尖峰神经元模型的比较 | 第18-22页 |
| ·多神经元模型的比较 | 第22-24页 |
| ·本章小结 | 第24-25页 |
| 3 尖峰神经元模型的仿真研究及时空整合 | 第25-36页 |
| ·Izhikevich模型 | 第25-30页 |
| ·概述 | 第25页 |
| ·尖峰神经元动力学描述及仿真研究 | 第25-30页 |
| ·模型各个参数的作用 | 第30页 |
| ·神经元时间和空间上的叠加 | 第30-33页 |
| ·空间上的叠加 | 第31-32页 |
| ·时间上的叠加 | 第32-33页 |
| ·突触前神经元数目的变化对突触后神经元的影响 | 第33-35页 |
| ·本章小结 | 第35-36页 |
| 4 基于多巴胺调节特性的学习能力研究 | 第36-48页 |
| ·突触的相关介绍 | 第36-37页 |
| ·突触的基本简介 | 第36页 |
| ·突触可塑性研究 | 第36-37页 |
| ·多巴胺概述与条件反射 | 第37-38页 |
| ·基于多巴胺的突触可塑性研究 | 第38-43页 |
| ·多巴胺调节的LTP | 第38-42页 |
| ·多巴胺调节的LTD | 第42-43页 |
| ·多巴胺延时释放时间对突触强度的影响 | 第43-47页 |
| ·基于LTP过程多巴胺延时时间变化时突触强度的变化 | 第43-45页 |
| ·基于LTD过程多巴胺延时时间变化时突触强度的变化 | 第45-47页 |
| ·本章小结 | 第47-48页 |
| 5 基于尖峰神经元模型强化学习思想在机器人中的应用 | 第48-59页 |
| ·仿真平台的介绍 | 第48页 |
| ·仿真设计 | 第48-54页 |
| ·仿真过程的基本思路设计 | 第48-50页 |
| ·仿真程序设计 | 第50-52页 |
| ·仿真环境的构造 | 第52-54页 |
| ·三路口迷宫仿真 | 第54-58页 |
| ·仿真设置 | 第54-55页 |
| ·结果与分析 | 第55-58页 |
| ·本章小结 | 第58-59页 |
| 6 迷宫结构及模型参数对机器人学习能力影响的研究 | 第59-73页 |
| ·迷宫复杂度变化时机器人的学习能力研究 | 第59-61页 |
| ·奖励延时时间变化时机器人学习能力的变化 | 第61-65页 |
| ·神经元数目变化对机器人学习能力的影响 | 第65-72页 |
| ·控制器神经元数目对机器人学习能力的影响 | 第65-68页 |
| ·传感器神经元数目变化对机器人学习能力的影响 | 第68-72页 |
| ·本章小结 | 第72-73页 |
| 7 结论与展望 | 第73-75页 |
| ·本文的主要工作 | 第73页 |
| ·展望 | 第73-75页 |
| 致谢 | 第75-76页 |
| 参考文献 | 第76-78页 |