首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于DFL的多agent学习模型研究

学位论文独创性声明第1页
学位论文使用授权声明第2-3页
中文摘要第3-4页
ABSTRACT第4-7页
第一章 引言第7-11页
   ·AGENT 学习综述第7-9页
     ·Agent 学习方法策略分类第7页
     ·Agent 学习的特点第7-8页
     ·Agent 学习的研究现状第8-9页
   ·问题的提出第9-10页
   ·内容安排第10-11页
第二章 理论工具——动态模糊逻辑第11-18页
   ·动态模糊(DF)布尔量第11-12页
     ·DF 数布尔量第11-12页
     ·DF 区间布尔量第12页
     ·DF 语言值布尔量第12页
   ·DF 命题逻辑公式第12-17页
     ·DF 命题的基本概念第12-15页
     ·DF 命题公式的范式第15-17页
   ·DF 代数操作第17页
   ·本章小结第17-18页
第三章 基于DFL 的AGENT 心智模型研究第18-27页
   ·基于DFL 的AGENT 心智模型结构第18-23页
   ·基于DFL 的AGENT 心智状态的相关公理第23-24页
   ·基于DFL 的AGENT 工作原理第24-26页
   ·本章小结第26-27页
第四章 基于DFL 的单AGENT 学习算法第27-33页
   ·AGENT 的学习任务第27页
   ·基于DFL 的即时回报单AGENT 学习算法第27-29页
   ·基于DFL 的 Q-LEARNING 函数第29-30页
   ·基于DFL 的 Q-LEARNING 算法第30-32页
   ·本章小结第32-33页
第五章 基于DFL 的多AGENT 学习模型第33-56页
   ·基于DFL 的多AGENT 学习模型[33]第33-34页
   ·基于DFL 的合作型多AGENT 学习模型算法第34-55页
     ·即时回报的普通合作型多agent 学习模型第34-36页
     ·即时回报的统筹合作型多agent 学习模型第36-45页
     ·非即时回报的合作型多agent 学习模型第45-55页
   ·基于DFL 的竞争型多AGENT 学习模型算法第55页
   ·本章小结第55-56页
第六章 模型验证第56-70页
   ·模型在纸牌游戏中的应用第56-69页
     ·问题描述第56-57页
     ·规则库的定义第57-61页
     ·匹配度(α,α) 的修改第61-69页
       ·算法在争上游游戏中的应用第62-66页
       ·算法在斗地主游戏中的应用第66-69页
   ·本章小结第69-70页
第七章 结论与展望第70-71页
   ·论文总结第70页
   ·工作展望第70-71页
参考文献第71-74页
致谢第74-75页
附录第75-78页
 科研情况第75页
 获奖情况第75页
 论文发表情况第75-76页
 中英文名词对照第76-78页
中文详细摘要第78-80页

论文共80页,点击 下载论文
上一篇:一个协同编辑器中并发控制算法的研究与实现
下一篇:机械式脉动无级变速器(DBL型)连杆有限元分析及变速机构的改进