首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于智能体系统的Q-学习算法的研究与改进

摘要第1-8页
ABSTRACT第8-13页
第1章 绪论第13-25页
   ·机器学习第13-17页
     ·机器学习的发展第13-14页
     ·强化学习发展及应用第14-17页
   ·智能体系统概述第17-23页
     ·智能体定义第17-18页
     ·智能体与环境第18-19页
     ·智能体结构与模型第19-20页
     ·智能体的强化学习第20-23页
   ·本文的研究目的及意义第23-24页
   ·本文的主要内容第24-25页
第2章 强化学习理论及其主要算法第25-38页
   ·MARKOV 决策过程第25-26页
   ·强化学习基本原理及模型第26-28页
   ·强化学习系统的组成要素第28-30页
   ·强化学习的主要算法第30-37页
     ·动态规划第30-31页
     ·蒙特卡罗算法第31-32页
     ·瞬时差分算法第32-33页
     ·Q-学习算法第33-37页
   ·本章小结第37-38页
第3章 基于启发知识的Q-学习模型与算法研究第38-51页
   ·基于启发知识的Q-学习算法研究第38-44页
     ·基于启发知识的Q-学习算法主要原理第38-40页
     ·算法在单智能体环境中的应用第40页
     ·实验仿真及结果分析第40-44页
   ·基于启发知识的并行Q-学习算法研究第44-50页
     ·基于启发知识的并行Q-学习算法主要原理第44-46页
     ·算法在多智能体环境中的应用第46页
     ·实验仿真及结果分析第46-50页
   ·本章小结第50-51页
第4章 一种基于模糊推理的Q-学习模型与算法研究第51-62页
   ·模块化Q-学习方法第51-53页
   ·模糊逻辑概述第53-56页
   ·一种基于多智能体的模糊Q-学习算法第56-58页
     ·模糊Q-学习算法第56-57页
     ·强化函数的设计第57-58页
   ·算法在多智能体系统中的应用第58-60页
   ·实验仿真及结果分析第60-61页
   ·本章小结第61-62页
结论第62-63页
参考文献第63-67页
攻读硕士学位期间所发表的学术论文第67-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:模具钢表面TD法制备碳化钒覆层的研究
下一篇:反腐败的理性选择--预防职务犯罪