基于决策理论的多智能体系统规划问题研究
| 摘要 | 第1-7页 |
| ABSTRACT | 第7-10页 |
| 目录 | 第10-13页 |
| 表格 | 第13-14页 |
| 插图 | 第14-15页 |
| 算法 | 第15-16页 |
| 主要符号对照表 | 第16-18页 |
| 第一章 绪论 | 第18-28页 |
| ·引言 | 第18-19页 |
| ·不确定性环境下的决策与规划 | 第19-22页 |
| ·多智能体系统的协调与合作 | 第22-25页 |
| ·论文的内容与组织结构 | 第25-28页 |
| 第二章 多智能体的马尔科夫决策模型 | 第28-46页 |
| ·分布式局部可观察马尔科夫决策过程 | 第28-32页 |
| ·离线规划的基本原理及存在的问题 | 第32-40页 |
| ·离线精确求解算法 | 第33-36页 |
| ·离线近似求解算法 | 第36-40页 |
| ·在线规划及受限通讯的一般解决方案 | 第40-44页 |
| ·在线协调机制 | 第40-42页 |
| ·在线通讯策略 | 第42-44页 |
| ·本章小结 | 第44-46页 |
| 第三章 通讯受限的在线规划算法 | 第46-76页 |
| ·保证多智能体策略协调性的规划框架 | 第46-51页 |
| ·基于线性规划的快速在线策略求解 | 第51-55页 |
| ·基于策略相似性的历史信息归并 | 第55-60页 |
| ·基于信念一致性检测的通讯策略 | 第60-64页 |
| ·信念池结构的具体算法实现 | 第64-66页 |
| ·实验结果 | 第66-74页 |
| ·完全可靠通讯信道问题 | 第68-72页 |
| ·非可靠通讯信道问题 | 第72-74页 |
| ·本章小结 | 第74-76页 |
| 第四章 有限资源离线规划算法 | 第76-98页 |
| ·基于信念状态的快速策略生成 | 第77-83页 |
| ·生成策略的问题描述 | 第77-79页 |
| ·子策略映射的近似求解 | 第79-82页 |
| ·算法的描述和复杂度分析 | 第82-83页 |
| ·基于测试反馈的近似策略评估 | 第83-89页 |
| ·信念状态生成 | 第83-85页 |
| ·策略的参数改进 | 第85-86页 |
| ·策略期望值评价 | 第86-88页 |
| ·算法的多线程实现 | 第88-89页 |
| ·实验结果 | 第89-96页 |
| ·基于信念点的策略生成算法实验 | 第89-93页 |
| ·基于测试的策略评价算法实验 | 第93-96页 |
| ·本章小结 | 第96-98页 |
| 第5章 无模型的蒙特卡罗规划算法 | 第98-110页 |
| ·蒙特卡罗离线规划算法 | 第99-104页 |
| ·基于启发式策略的状态采样 | 第100-101页 |
| ·基于参数估计的策略改进 | 第101-103页 |
| ·算法复杂度分析 | 第103-104页 |
| ·实验结果 | 第104-107页 |
| ·标准测试集问题 | 第104-106页 |
| ·分布式传感器网络问题示例 | 第106-107页 |
| ·本章小结 | 第107-110页 |
| 第6章 总结与展望 | 第110-116页 |
| ·工作总结 | 第110-114页 |
| ·前景展望 | 第114-116页 |
| 参考文献 | 第116-122页 |
| 第A章 机器人足球问题简介 | 第122-124页 |
| 致谢 | 第124-126页 |
| 在读期间发表的学术论文与取得的研究成果 | 第126-127页 |