基于DFL的多agent学习模型研究

学位论文独创性声明	第1页
学位论文使用授权声明	第2-3页
中文摘要	第3-4页
ABSTRACT	第4-7页
第一章引言	第7-11页
·AGENT 学习综述	第7-9页
·Agent 学习方法策略分类	第7页
·Agent 学习的特点	第7-8页
·Agent 学习的研究现状	第8-9页
·问题的提出	第9-10页
·内容安排	第10-11页
第二章理论工具——动态模糊逻辑	第11-18页
·动态模糊（DF）布尔量	第11-12页
·DF 数布尔量	第11-12页
·DF 区间布尔量	第12页
·DF 语言值布尔量	第12页
·DF 命题逻辑公式	第12-17页
·DF 命题的基本概念	第12-15页
·DF 命题公式的范式	第15-17页
·DF 代数操作	第17页
·本章小结	第17-18页
第三章基于DFL 的AGENT 心智模型研究	第18-27页
·基于DFL 的AGENT 心智模型结构	第18-23页
·基于DFL 的AGENT 心智状态的相关公理	第23-24页
·基于DFL 的AGENT 工作原理	第24-26页
·本章小结	第26-27页
第四章基于DFL 的单AGENT 学习算法	第27-33页
·AGENT 的学习任务	第27页
·基于DFL 的即时回报单AGENT 学习算法	第27-29页
·基于DFL 的 Q-LEARNING 函数	第29-30页
·基于DFL 的 Q-LEARNING 算法	第30-32页
·本章小结	第32-33页
第五章基于DFL 的多AGENT 学习模型	第33-56页
·基于DFL 的多AGENT 学习模型[33]	第33-34页
·基于DFL 的合作型多AGENT 学习模型算法	第34-55页
·即时回报的普通合作型多agent 学习模型	第34-36页
·即时回报的统筹合作型多agent 学习模型	第36-45页
·非即时回报的合作型多agent 学习模型	第45-55页
·基于DFL 的竞争型多AGENT 学习模型算法	第55页
·本章小结	第55-56页
第六章模型验证	第56-70页
·模型在纸牌游戏中的应用	第56-69页
·问题描述	第56-57页
·规则库的定义	第57-61页
·匹配度(α,α) 的修改	第61-69页
·算法在争上游游戏中的应用	第62-66页
·算法在斗地主游戏中的应用	第66-69页
·本章小结	第69-70页
第七章结论与展望	第70-71页
·论文总结	第70页
·工作展望	第70-71页
参考文献	第71-74页
致谢	第74-75页
附录	第75-78页
科研情况	第75页
获奖情况	第75页
论文发表情况	第75-76页
中英文名词对照	第76-78页
中文详细摘要	第78-80页