面向决策仿真的Agent模型中强化学习方法的研究

摘要	第1-4页
Abstract	第4-7页
第一章绪论	第7-11页
·引言	第7页
·研究目标与意义	第7-8页
·国内外研究现状	第8-9页
·研究内容	第9-10页
·论文组织结构	第10-11页
第二章相关理论与技术	第11-21页
·Agent 理论与技术	第11-13页
·Agent 定义	第11页
·Agent 特性	第11-12页
·BDI 模型简介	第12-13页
·强化学习基本概念	第13-16页
·强化学习原理	第13-14页
·强化学习的特点	第14-15页
·马尔科夫决策过程	第15-16页
·强化学习相关算法	第16-21页
·TD 算法	第17-18页
·Q 学习算法	第18-19页
·Sarsa 算法	第19-21页
第三章基于 Agent 的决策仿真系统框架	第21-27页
·分层学习及决策过程	第21-23页
·自底向上的学习过程	第21-22页
·自顶向下的决策过程	第22-23页
·多任务分解学习的智能化框架	第23-24页
·模型中各模块功能设计	第24-27页
第四章决策仿真系统中 Agent 的认知模型	第27-41页
·Agent 认知模型	第27-30页
·形式化定义	第27-28页
·认知结构模型	第28-30页
·Agent 模型内部结构设计	第30-36页
·各模块交互过程设计	第30-31页
·各模块功能设计	第31-36页
·Agent 的决策与学习行为设计	第36-41页
·Agent 的决策与学习过程	第36-37页
·Agent 的运行流程	第37-39页
·Agent 的状态转换	第39-41页
第五章强化学习方法在决策仿真系统中的应用	第41-49页
·单 Agent Q 学习算法研究	第41-44页
·Q 学习算法分析	第41-42页
·改进 Q 学习模型描述	第42-43页
·改进 Q 学习算法描述	第43-44页
·多 Agent 联合强化学习	第44-49页
·多 Agent 强化学习信度分配问题	第45-46页
·多 Agent 联合 Q 学习算法	第46-49页
第六章实验研究	第49-57页
·实验目的	第49页
·实验环境	第49页
·实验过程及结果分析	第49-57页
·Agent 认知模型的有效性验证	第50-53页
·单 Agent 强化学习算法效率验证	第53-54页
·多 Agent 联合强化学习算法效率验证	第54-57页
结束语	第57-59页
致谢	第59-61页
参考文献	第61-65页
在研期间研究成果	第65-66页