摘要 | 第1-6页 |
Abstract | 第6-17页 |
第1章 绪论 | 第17-38页 |
·课题背景 | 第17-18页 |
·多智能体系统概述 | 第18-24页 |
·多智能体系统的基本概念 | 第18-19页 |
·多智能体系统的规划 | 第19-23页 |
·协调与协作 | 第23-24页 |
·通信 | 第24页 |
·多智能体系统的建模方法 | 第24页 |
·基于通信的多智能体系统研究现状 | 第24-28页 |
·多智能体系统中通信问题的主要研究内容及研究进展 | 第28-33页 |
·通信决策 | 第28-29页 |
·通信的代价 | 第29-30页 |
·通信失败与恢复 | 第30页 |
·通信语言 | 第30-33页 |
·多智能体强化学习 | 第33-34页 |
·部分可观察马尔可夫决策过程 | 第34-36页 |
·单智能体部分可观察马尔可夫过程 | 第34-35页 |
·多智能体部分可观察马尔可夫过程 | 第35-36页 |
·本文主要研究问题 | 第36-38页 |
第2章 基于通信的多智能体系统建模 | 第38-47页 |
·引言 | 第38-39页 |
·通信方式 | 第39-41页 |
·间接通信 | 第39页 |
·直接通信 | 第39-40页 |
·公共不可控特征 | 第40-41页 |
·各种通信方式的比较 | 第41页 |
·基于通信的多智能体系统建模方法 | 第41-46页 |
·隐式建模 | 第41-43页 |
·显式建模 | 第43-46页 |
·本章小结 | 第46-47页 |
第3章 无偿通信时基于强化学习的多智能体系统集中式控制算法 | 第47-62页 |
·引言 | 第47-48页 |
·通信代价的参数表示以及计算复杂度分析 | 第48-49页 |
·部分可观察马尔可夫决策过程 | 第49-50页 |
·无偿通信时多智能体系统集中控制模型 | 第50-51页 |
·基于进化算法的Q 学习算法 | 第51-59页 |
·Q 学习 | 第52-53页 |
·结合进化算法的Q 学习 | 第53-54页 |
·利用进化强化学习算法求解POMDP 问题 | 第54-57页 |
·典型的POMDP 实例问题实验 | 第57-59页 |
·无偿通信时多智能体系统协调实验及结果分析 | 第59-61页 |
·本章小结 | 第61-62页 |
第4章 基于有向无环图的多智能体系统分散式通信决策算法 | 第62-74页 |
·引言 | 第62-63页 |
·多智能体部分可观察马尔可夫过程模型 | 第63-64页 |
·基于有向无环图的分散式通信决策算法 | 第64-69页 |
·有向无环图的基本概念 | 第64-65页 |
·基于有向无环图的可能联合信度表示 | 第65-67页 |
·可能联合信度上的推理 | 第67-68页 |
·分散式通信决策算法 | 第68-69页 |
·同步 | 第69页 |
·基于通信的多智能体协调实验与分析 | 第69-73页 |
·例子 | 第69-72页 |
·结果和分析 | 第72-73页 |
·本章小结 | 第73-74页 |
第5章 通信不可靠时的多智能体分布式约束优化算法 | 第74-93页 |
·引言 | 第74-75页 |
·多智能体系统中的不可靠通信问题 | 第75-76页 |
·分布式约束优化问题定义 | 第76-78页 |
·异步分布式约束优化算法 | 第78-84页 |
·基本思想 | 第78-79页 |
·分布式约束优化问题的异步搜索 | 第79-84页 |
·改进的分布式约束优化算法 | 第84-90页 |
·处理消息丢失 | 第84-86页 |
·减少通信的数量 | 第86-87页 |
·改进算法的描述 | 第87-90页 |
·通信不可靠时的分布式约束优化实验及结果分析 | 第90-92页 |
·本章小结 | 第92-93页 |
第6章 基于无线通信的多智能体机器人系统的设计与实现 | 第93-112页 |
·引言 | 第93-94页 |
·基于行为的多机器人系统分布式体系结构 | 第94-95页 |
·基于移动信息设备的多智能体人-多机器人系统设计 | 第95-99页 |
·基于移动信息设备的多智能体人-多机器人系统硬件系统 | 第95-98页 |
·多智能体人-机器人系统体系结构 | 第98-99页 |
·基于移动信息设备的人-机器人通信系统设计 | 第99-102页 |
·移动信息设备管理智能体设计 | 第99-100页 |
·手机端的应用程序 | 第100-101页 |
·系统的安全性设计 | 第101页 |
·机器人的控制方式 | 第101-102页 |
·基于WLAN 的多机器人通信系统设计 | 第102-104页 |
·网络拓扑结构 | 第102页 |
·通信协议 | 第102页 |
·通信内容 | 第102-104页 |
·人-机器人混合团队通信实验与分析 | 第104-107页 |
·遥操作实验 | 第104-105页 |
·对家庭环境的及时报警实验 | 第105页 |
·短消息的响应时间测试实验 | 第105-107页 |
·多机器人系统通信实验与分析 | 第107-111页 |
·系统设计 | 第107-108页 |
·多机器人搜集任务实验 | 第108-111页 |
·本章小结 | 第111-112页 |
结论 | 第112-114页 |
参考文献 | 第114-127页 |
附录 A | 第127-130页 |
附录 B | 第130-131页 |
攻读学位期间发表的学术论文 | 第131页 |
著作权 | 第131-133页 |
致谢 | 第133-134页 |
个人简历 | 第134页 |