基于DFL的多agent学习模型研究
学位论文独创性声明 | 第1页 |
学位论文使用授权声明 | 第2-3页 |
中文摘要 | 第3-4页 |
ABSTRACT | 第4-7页 |
第一章 引言 | 第7-11页 |
·AGENT 学习综述 | 第7-9页 |
·Agent 学习方法策略分类 | 第7页 |
·Agent 学习的特点 | 第7-8页 |
·Agent 学习的研究现状 | 第8-9页 |
·问题的提出 | 第9-10页 |
·内容安排 | 第10-11页 |
第二章 理论工具——动态模糊逻辑 | 第11-18页 |
·动态模糊(DF)布尔量 | 第11-12页 |
·DF 数布尔量 | 第11-12页 |
·DF 区间布尔量 | 第12页 |
·DF 语言值布尔量 | 第12页 |
·DF 命题逻辑公式 | 第12-17页 |
·DF 命题的基本概念 | 第12-15页 |
·DF 命题公式的范式 | 第15-17页 |
·DF 代数操作 | 第17页 |
·本章小结 | 第17-18页 |
第三章 基于DFL 的AGENT 心智模型研究 | 第18-27页 |
·基于DFL 的AGENT 心智模型结构 | 第18-23页 |
·基于DFL 的AGENT 心智状态的相关公理 | 第23-24页 |
·基于DFL 的AGENT 工作原理 | 第24-26页 |
·本章小结 | 第26-27页 |
第四章 基于DFL 的单AGENT 学习算法 | 第27-33页 |
·AGENT 的学习任务 | 第27页 |
·基于DFL 的即时回报单AGENT 学习算法 | 第27-29页 |
·基于DFL 的 Q-LEARNING 函数 | 第29-30页 |
·基于DFL 的 Q-LEARNING 算法 | 第30-32页 |
·本章小结 | 第32-33页 |
第五章 基于DFL 的多AGENT 学习模型 | 第33-56页 |
·基于DFL 的多AGENT 学习模型[33] | 第33-34页 |
·基于DFL 的合作型多AGENT 学习模型算法 | 第34-55页 |
·即时回报的普通合作型多agent 学习模型 | 第34-36页 |
·即时回报的统筹合作型多agent 学习模型 | 第36-45页 |
·非即时回报的合作型多agent 学习模型 | 第45-55页 |
·基于DFL 的竞争型多AGENT 学习模型算法 | 第55页 |
·本章小结 | 第55-56页 |
第六章 模型验证 | 第56-70页 |
·模型在纸牌游戏中的应用 | 第56-69页 |
·问题描述 | 第56-57页 |
·规则库的定义 | 第57-61页 |
·匹配度(α,α) 的修改 | 第61-69页 |
·算法在争上游游戏中的应用 | 第62-66页 |
·算法在斗地主游戏中的应用 | 第66-69页 |
·本章小结 | 第69-70页 |
第七章 结论与展望 | 第70-71页 |
·论文总结 | 第70页 |
·工作展望 | 第70-71页 |
参考文献 | 第71-74页 |
致谢 | 第74-75页 |
附录 | 第75-78页 |
科研情况 | 第75页 |
获奖情况 | 第75页 |
论文发表情况 | 第75-76页 |
中英文名词对照 | 第76-78页 |
中文详细摘要 | 第78-80页 |