MAS中的自治协商模型优化研究
摘要 | 第1-5页 |
ABSTRACT | 第5-11页 |
第1章 绪论 | 第11-19页 |
·背景与动因 | 第11-12页 |
·研究现状 | 第12-16页 |
·自治协商研究现状 | 第12-13页 |
·协商僵局消解的研究现状 | 第13-14页 |
·分层强化学习研究现状 | 第14-16页 |
·论文的主要研究内容 | 第16-17页 |
·论文的组织结构 | 第17-19页 |
第2章 多Agent及其协商理论 | 第19-35页 |
·Agent技术与发展 | 第19-22页 |
·Agent的概念和特征 | 第19-21页 |
·Agent的特征 | 第21-22页 |
·MAS系统的研究 | 第22-26页 |
·多Agent系统的特征 | 第23-25页 |
·多Agent之间的通信与协作 | 第25-26页 |
·多Agent协商 | 第26-35页 |
·协商概述 | 第26-28页 |
·协商研究范畴 | 第28-31页 |
·协商僵局 | 第31-32页 |
·僵局消解方法 | 第32-35页 |
第3章 分层强化学习 | 第35-53页 |
·强化学习 | 第35-37页 |
·MDP和SMDP | 第37-38页 |
·Q-学习 | 第38-40页 |
·分层强化学习 | 第40-46页 |
·Option | 第40-42页 |
·HAM | 第42页 |
·MAXQ | 第42-44页 |
·HEXQ | 第44-46页 |
·自动创建Option | 第46-53页 |
·自动发现子目标 | 第47-49页 |
·自动创建Option | 第49-53页 |
第4章 自治协商模型框架 | 第53-63页 |
·理论基础 | 第53页 |
·双边多议题自治协商模型 | 第53-63页 |
·ANMEC的第一层形式化描述 | 第54页 |
·协商议题-Ⅰ | 第54-55页 |
·协商效用评价机制-U | 第55-56页 |
·学习机制-L | 第56-57页 |
·提议策略-S | 第57-60页 |
·协商协议-P | 第60-63页 |
第5章 协商模型优化设计 | 第63-73页 |
·协商模型及僵局消解过程设计 | 第63-66页 |
·协商模型设计 | 第63-66页 |
·僵局消解过程算法设计 | 第66页 |
·基于Q-学习的僵局消解设计 | 第66-67页 |
·基于分层强化学习的僵局消解设计 | 第67-73页 |
·僵局发现算法设计 | 第69页 |
·Option构建算法设计 | 第69-70页 |
·基于Option方法的僵局消解算法设计 | 第70-73页 |
第6章 协商模型优化实现 | 第73-77页 |
第7章 结论与展望 | 第77-79页 |
参考文献 | 第79-85页 |
致谢 | 第85-86页 |
作者在攻硕期间发表的论文 | 第86页 |