首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

面向决策仿真的Agent模型中强化学习方法的研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-11页
   ·引言第7页
   ·研究目标与意义第7-8页
   ·国内外研究现状第8-9页
   ·研究内容第9-10页
   ·论文组织结构第10-11页
第二章 相关理论与技术第11-21页
   ·Agent 理论与技术第11-13页
     ·Agent 定义第11页
     ·Agent 特性第11-12页
     ·BDI 模型简介第12-13页
   ·强化学习基本概念第13-16页
     ·强化学习原理第13-14页
     ·强化学习的特点第14-15页
     ·马尔科夫决策过程第15-16页
   ·强化学习相关算法第16-21页
     ·TD 算法第17-18页
     ·Q 学习算法第18-19页
     ·Sarsa 算法第19-21页
第三章 基于 Agent 的决策仿真系统框架第21-27页
   ·分层学习及决策过程第21-23页
     ·自底向上的学习过程第21-22页
     ·自顶向下的决策过程第22-23页
   ·多任务分解学习的智能化框架第23-24页
   ·模型中各模块功能设计第24-27页
第四章 决策仿真系统中 Agent 的认知模型第27-41页
   ·Agent 认知模型第27-30页
     ·形式化定义第27-28页
     ·认知结构模型第28-30页
   ·Agent 模型内部结构设计第30-36页
     ·各模块交互过程设计第30-31页
     ·各模块功能设计第31-36页
   ·Agent 的决策与学习行为设计第36-41页
     ·Agent 的决策与学习过程第36-37页
     ·Agent 的运行流程第37-39页
     ·Agent 的状态转换第39-41页
第五章 强化学习方法在决策仿真系统中的应用第41-49页
   ·单 Agent Q 学习算法研究第41-44页
     ·Q 学习算法分析第41-42页
     ·改进 Q 学习模型描述第42-43页
     ·改进 Q 学习算法描述第43-44页
   ·多 Agent 联合强化学习第44-49页
     ·多 Agent 强化学习信度分配问题第45-46页
     ·多 Agent 联合 Q 学习算法第46-49页
第六章 实验研究第49-57页
   ·实验目的第49页
   ·实验环境第49页
   ·实验过程及结果分析第49-57页
     ·Agent 认知模型的有效性验证第50-53页
     ·单 Agent 强化学习算法效率验证第53-54页
     ·多 Agent 联合强化学习算法效率验证第54-57页
结束语第57-59页
致谢第59-61页
参考文献第61-65页
在研期间研究成果第65-66页

论文共66页,点击 下载论文
上一篇:基于二分类SVM的多分类方法比较研究
下一篇:基于LabVIEW的虚拟自动测试装置的研究与开发