首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于视觉听觉语义相干性的强化学习系统的研究

摘要第1-8页
ABSTRACT第8-11页
目录第11-14页
图索引第14-17页
表索引第17-19页
第一章 绪论第19-31页
   ·研究背景和意义第19-21页
   ·学习系统设计的理论基础第21-24页
   ·学习系统实现的技术基础第24-27页
   ·研究目标与主要内容第27-28页
   ·论文结构第28-29页
   ·本章小结第29-31页
第二章 Agent与多Agent系统结构第31-45页
   ·Agent技术第31-34页
     ·Agent的定义第31-33页
     ·Agent的环境特点第33-34页
   ·Agent的体系结构第34-37页
   ·多Agent系统的研究现状第37-39页
   ·多Agent系统的结构第39-44页
     ·多Agent系统协作的基本模型第39-41页
     ·多Agent系统的体系结构第41-42页
     ·多Agent系统中的协商、协作和协调第42-44页
   ·本章小结第44-45页
第三章 强化学习第45-73页
   ·强化学习的发展及研究现状第45-47页
   ·马尔可夫决策过程与最优准则第47-54页
     ·马尔可夫决策过程(MDP)第48-50页
     ·最优准则第50-54页
   ·强化学习的主要算法第54-63页
     ·TD学习算法第55-58页
     ·Q学习算法第58-61页
     ·Q学习的动作选择机制第61-63页
   ·基于偏向信息学习的强化学习算法第63-71页
     ·研究背景描述第64-65页
     ·基于偏向信息学习的强化学习模型第65-67页
     ·基于偏向信息强化学习的过程和机制第67-70页
     ·实验验证与分析第70-71页
   ·本章小结第71-73页
第四章 多Agent强化学习的自动分层算法第73-95页
   ·引言第73-74页
   ·多Agent强化学习第74-82页
     ·基本理论及特性第74-77页
     ·随机博弈框架第77-80页
     ·学习算法的分类第80-82页
   ·连续状态空间下多Agent分层强化学习第82-92页
     ·MAHRL的模型基础第83-84页
     ·半马氏博弈模型第84-86页
     ·MAHRL的协同框架第86-88页
     ·基于Pareto占优解的MAHRL算法第88-92页
   ·实验及结果分析第92-93页
   ·本章小结第93-95页
第五章 基于视觉听觉语义相干性的强化学习系统开发与应用第95-117页
   ·应用背景描述第95-97页
   ·学习材料的建立和组织第97-98页
   ·学习者个性化信息获取第98-107页
     ·学习者个性描述模型第99-101页
     ·学习者性格特征测试第101-107页
   ·培训系统的学习机制第107-112页
     ·个体情感的计算模型第107-108页
     ·专业技能学习第108-110页
     ·心理素质训练第110-112页
   ·系统的工作方式第112-116页
   ·本章小结第116-117页
第六章 总结和展望第117-119页
参考文献第119-127页
致谢第127-129页
攻读学位期间完成的论文第129页

论文共129页,点击 下载论文
上一篇:电液伺服力控系统的鲁棒迭代学习控制方法研究
下一篇:基于ERPs的听觉感知及与视觉相干性研究