基于视觉听觉语义相干性的强化学习系统的研究

摘要	第1-8页
ABSTRACT	第8-11页
目录	第11-14页
图索引	第14-17页
表索引	第17-19页
第一章绪论	第19-31页
·研究背景和意义	第19-21页
·学习系统设计的理论基础	第21-24页
·学习系统实现的技术基础	第24-27页
·研究目标与主要内容	第27-28页
·论文结构	第28-29页
·本章小结	第29-31页
第二章 Agent与多Agent系统结构	第31-45页
·Agent技术	第31-34页
·Agent的定义	第31-33页
·Agent的环境特点	第33-34页
·Agent的体系结构	第34-37页
·多Agent系统的研究现状	第37-39页
·多Agent系统的结构	第39-44页
·多Agent系统协作的基本模型	第39-41页
·多Agent系统的体系结构	第41-42页
·多Agent系统中的协商、协作和协调	第42-44页
·本章小结	第44-45页
第三章强化学习	第45-73页
·强化学习的发展及研究现状	第45-47页
·马尔可夫决策过程与最优准则	第47-54页
·马尔可夫决策过程(MDP)	第48-50页
·最优准则	第50-54页
·强化学习的主要算法	第54-63页
·TD学习算法	第55-58页
·Q学习算法	第58-61页
·Q学习的动作选择机制	第61-63页
·基于偏向信息学习的强化学习算法	第63-71页
·研究背景描述	第64-65页
·基于偏向信息学习的强化学习模型	第65-67页
·基于偏向信息强化学习的过程和机制	第67-70页
·实验验证与分析	第70-71页
·本章小结	第71-73页
第四章多Agent强化学习的自动分层算法	第73-95页
·引言	第73-74页
·多Agent强化学习	第74-82页
·基本理论及特性	第74-77页
·随机博弈框架	第77-80页
·学习算法的分类	第80-82页
·连续状态空间下多Agent分层强化学习	第82-92页
·MAHRL的模型基础	第83-84页
·半马氏博弈模型	第84-86页
·MAHRL的协同框架	第86-88页
·基于Pareto占优解的MAHRL算法	第88-92页
·实验及结果分析	第92-93页
·本章小结	第93-95页
第五章基于视觉听觉语义相干性的强化学习系统开发与应用	第95-117页
·应用背景描述	第95-97页
·学习材料的建立和组织	第97-98页
·学习者个性化信息获取	第98-107页
·学习者个性描述模型	第99-101页
·学习者性格特征测试	第101-107页
·培训系统的学习机制	第107-112页
·个体情感的计算模型	第107-108页
·专业技能学习	第108-110页
·心理素质训练	第110-112页
·系统的工作方式	第112-116页
·本章小结	第116-117页
第六章总结和展望	第117-119页
参考文献	第119-127页
致谢	第127-129页
攻读学位期间完成的论文	第129页