具有认知能力的智能机器人行为学习方法研究

摘要	第1-7页
Abstract	第7-12页
第1章绪论	第12-24页
·课题的研究目的和意义	第12-13页
·相关领域研究现状	第13-21页
·具有认知能力的机器人系统	第13-16页
·机器人行为学习研究现状	第16-17页
·认知模型研究现状	第17-18页
·具有认知能力的学习方法	第18-21页
·本文的研究内容	第21-22页
·论文的组织结构	第22-24页
第2章具有认知能力的智能机器人体系结构	第24-38页
·智能机器人传统范式分类	第24-28页
·分层范式	第25页
·反应范式	第25-26页
·慎思/反应范式	第26-27页
·传统范式分类的依据及存在的问题	第27-28页
·基于智能产生方式对智能机器人范式分类	第28-31页
·具有认知能力的智能机器人体系结构	第31-37页
·认知模型的结构	第33-34页
·认知模型的知识表示	第34-35页
·体系结构中的信息交互和学习机制	第35-37页
·本章小结	第37-38页
第3章基于GDSOM 的环境路标自组织提取	第38-61页
·移动机器人的感知能力	第38-40页
·机器人传感器信息的分类	第38-39页
·环境特征的知觉过程	第39-40页
·移动机器人的路标识别方法	第40-44页
·环境路标的定义	第40-41页
·自然路标的提取方法	第41-44页
·路标的自组织提取方法	第44-52页
·主动感知行为	第44-45页
·感知-运动协调的实现	第45-47页
·基于动态增长自组织特征图（GDSOM）的路标提取	第47-52页
·实验分析	第52-60页
·机器人实验平台	第52-54页
·路标的检测与识别	第54-60页
·与其它方法的比较	第60页
·本章小结	第60-61页
第4章基于STAMN 的时空经验学习方法研究	第61-94页
·时空经验的知识表示特点及其记忆结构	第61-63页
·观测驱动的马尔科夫决策过程	第63-68页
·POMDP 及求解算法	第64-65页
·ODMDP 的特点	第65-67页
·ODMDP 问题的求解策略	第67-68页
·时空联想记忆网络	第68-78页
·传统人工神经网络的缺陷	第68-70页
·STAMN 的结构与学习方法	第70-78页
·利用STAMN 实现机器人的空间认知	第78-91页
·利用STAMN 实现空间认知的过程	第79-80页
·简单循环对称环境的实验分析	第80-89页
·复杂循环对称环境的实验分析	第89-91页
·与拓扑地图的区别	第91-93页
·本章小结	第93-94页
第5章基于认知及强化学习的行为学习方法研究	第94-118页
·具有认知能力的强化学习特点	第94-95页
·具有认知能力的强化学习模型	第95-96页
·强化学习算法的分布式实现	第96-99页
·Q 学习的分布式实现	第97-98页
·Sarsa 算法的分布式实现	第98-99页
·Sarsa ( λ) 算法的分布式实现	第99页
·(K-M)(K-P) Sarsa 算法	第99-100页
·多任务强化学习模型	第100-105页
·意图模块	第101-102页
·回报模块	第102-103页
·行动选择机制	第103-104页
·多任务(K-M)(K-P) Sarsa 算法	第104-105页
·具有认知能力的机器人多任务学习	第105-117页
·具有认知能力的机器人行为结构图	第105-106页
·实验与分析	第106-117页
·本章小结	第117-118页
结论	第118-120页
参考文献	第120-128页
攻读博士学位期间发表的论文	第128-129页
致谢	第129页