摘 要 | 第4-5页 |
ABSTRACT | 第5页 |
第一章 绪论 | 第10-34页 |
1.1 引言 | 第10-12页 |
1.2 群体Agent合作求解逻辑模型 | 第12-20页 |
1.2.1 个体Agent思维状态模型 | 第12-18页 |
1.2.2 群体Agent思维状态模型 | 第18-20页 |
1.2.3 群体Agent合作求解过程 | 第20页 |
1.3 群体Agent合作求解方法 | 第20-27页 |
1.3.1 基于协商和协调的求解方法 | 第20-23页 |
1.3.2 群体Agent再励学习方法的研究 | 第23-25页 |
1.3.3 对策论方法的研究 | 第25-27页 |
1.4 群体Agent合作求解技术的应用 | 第27-32页 |
1.4.1 机器人足球赛 | 第27-31页 |
1.4.2 电子商务拍卖 | 第31-32页 |
1.5 本文的工作 | 第32-34页 |
第二章 群体AGENT合作求解的逻辑模型 | 第34-52页 |
2.1 引言 | 第34页 |
2.2 Agent合作模型 | 第34-38页 |
2.2.1 Agent语义模型 | 第34-36页 |
2.2.2 群体Agent合作求解过程 | 第36-38页 |
2.3 语法和语义模型 | 第38-41页 |
2.4 基本公理 | 第41-43页 |
2.5 群体Agent合作求解过程 | 第43-49页 |
2.5.1 合作求解动机的产生 | 第44-47页 |
2.5.2 团队的初步形成 | 第47页 |
2.5.3 任务分解和分配 | 第47-48页 |
2.5.4 团队最终形成 | 第48-49页 |
2.6 举例分析 | 第49-51页 |
小结 | 第51-52页 |
第三章 群体AGENT合作策略的表示与评估 | 第52-66页 |
3.1 引言 | 第52-53页 |
3.2 基于影响图的群体Agent合作求解模型 | 第53-55页 |
3.3 情景演算语言--ConGolog | 第55-57页 |
3.3.1 结构和语法 | 第55-56页 |
3.3.2 为什么使用ConGolog语言描述 | 第56-57页 |
3.4 评估算法 | 第57-60页 |
3.5 举例分析 | 第60-62页 |
3.6 假设与讨论 | 第62-64页 |
小结 | 第64-66页 |
第四章 一种基于角色跟踪的群体AGENT再励学习方法 | 第66-76页 |
4.1 引言 | 第66-68页 |
4.2 群体Agent学习模型 | 第68-69页 |
4.3 基于角色跟踪的再励学习算法 | 第69-71页 |
4.4 再励学习算法的评价标准 | 第71-72页 |
4.5 实验分析 | 第72-75页 |
小结 | 第75-76页 |
第五章 一种基于特征向量提取的FMDP模型求解方法 | 第76-94页 |
5.1 引言 | 第76-78页 |
5.2 FMDP模型和线性规划 | 第78-79页 |
5.3 状态特征向量 | 第79-81页 |
5.4 线性规划的近似求解 | 第81-84页 |
5.4.1 化简不等式 | 第82-83页 |
5.4.2 合并相似不等式 | 第83-84页 |
5.5 举例 | 第84-86页 |
5.6 基于状态特征向量的再励学习算法 | 第86-89页 |
5.6.1 传统的Q学习算法 | 第86-87页 |
5.6.2 K-Q再励学习算法 | 第87-89页 |
5.7 实验结果 | 第89-92页 |
小结 | 第92-94页 |
第六章 基于群体AGENT合作求解的MAS测试床 | 第94-103页 |
6.1 引言 | 第94-95页 |
6.2 MAS-Soccer测试床的系统结构 | 第95-98页 |
6.2.1 人机交互平台 | 第95-97页 |
6.2.2 服务平台 | 第97-98页 |
6.2.3 Agent足球队 | 第98页 |
6.3 MAS-Soccer运行流程 | 第98-99页 |
6.4 MAS-Soccer系统的BDI模型描述 | 第99-102页 |
6.4.1 Agent模型 | 第99-100页 |
6.4.2 Agent动作 | 第100页 |
6.4.3 对手模型 | 第100-102页 |
小结 | 第102-103页 |
结 论 | 第103-105页 |
参考文献 | 第105-116页 |
致谢及声明 | 第116-117页 |
个人简历、在学期间的研究成果及发表的论文 | 第117-118页 |