基于DFL的多agent学习模型研究
| 学位论文独创性声明 | 第1页 |
| 学位论文使用授权声明 | 第2-3页 |
| 中文摘要 | 第3-4页 |
| ABSTRACT | 第4-7页 |
| 第一章 引言 | 第7-11页 |
| ·AGENT 学习综述 | 第7-9页 |
| ·Agent 学习方法策略分类 | 第7页 |
| ·Agent 学习的特点 | 第7-8页 |
| ·Agent 学习的研究现状 | 第8-9页 |
| ·问题的提出 | 第9-10页 |
| ·内容安排 | 第10-11页 |
| 第二章 理论工具——动态模糊逻辑 | 第11-18页 |
| ·动态模糊(DF)布尔量 | 第11-12页 |
| ·DF 数布尔量 | 第11-12页 |
| ·DF 区间布尔量 | 第12页 |
| ·DF 语言值布尔量 | 第12页 |
| ·DF 命题逻辑公式 | 第12-17页 |
| ·DF 命题的基本概念 | 第12-15页 |
| ·DF 命题公式的范式 | 第15-17页 |
| ·DF 代数操作 | 第17页 |
| ·本章小结 | 第17-18页 |
| 第三章 基于DFL 的AGENT 心智模型研究 | 第18-27页 |
| ·基于DFL 的AGENT 心智模型结构 | 第18-23页 |
| ·基于DFL 的AGENT 心智状态的相关公理 | 第23-24页 |
| ·基于DFL 的AGENT 工作原理 | 第24-26页 |
| ·本章小结 | 第26-27页 |
| 第四章 基于DFL 的单AGENT 学习算法 | 第27-33页 |
| ·AGENT 的学习任务 | 第27页 |
| ·基于DFL 的即时回报单AGENT 学习算法 | 第27-29页 |
| ·基于DFL 的 Q-LEARNING 函数 | 第29-30页 |
| ·基于DFL 的 Q-LEARNING 算法 | 第30-32页 |
| ·本章小结 | 第32-33页 |
| 第五章 基于DFL 的多AGENT 学习模型 | 第33-56页 |
| ·基于DFL 的多AGENT 学习模型[33] | 第33-34页 |
| ·基于DFL 的合作型多AGENT 学习模型算法 | 第34-55页 |
| ·即时回报的普通合作型多agent 学习模型 | 第34-36页 |
| ·即时回报的统筹合作型多agent 学习模型 | 第36-45页 |
| ·非即时回报的合作型多agent 学习模型 | 第45-55页 |
| ·基于DFL 的竞争型多AGENT 学习模型算法 | 第55页 |
| ·本章小结 | 第55-56页 |
| 第六章 模型验证 | 第56-70页 |
| ·模型在纸牌游戏中的应用 | 第56-69页 |
| ·问题描述 | 第56-57页 |
| ·规则库的定义 | 第57-61页 |
| ·匹配度(α,α) 的修改 | 第61-69页 |
| ·算法在争上游游戏中的应用 | 第62-66页 |
| ·算法在斗地主游戏中的应用 | 第66-69页 |
| ·本章小结 | 第69-70页 |
| 第七章 结论与展望 | 第70-71页 |
| ·论文总结 | 第70页 |
| ·工作展望 | 第70-71页 |
| 参考文献 | 第71-74页 |
| 致谢 | 第74-75页 |
| 附录 | 第75-78页 |
| 科研情况 | 第75页 |
| 获奖情况 | 第75页 |
| 论文发表情况 | 第75-76页 |
| 中英文名词对照 | 第76-78页 |
| 中文详细摘要 | 第78-80页 |