基于决策理论的多智能体系统规划问题研究

摘要	第1-7页
ABSTRACT	第7-10页
目录	第10-13页
表格	第13-14页
插图	第14-15页
算法	第15-16页
主要符号对照表	第16-18页
第一章绪论	第18-28页
·引言	第18-19页
·不确定性环境下的决策与规划	第19-22页
·多智能体系统的协调与合作	第22-25页
·论文的内容与组织结构	第25-28页
第二章多智能体的马尔科夫决策模型	第28-46页
·分布式局部可观察马尔科夫决策过程	第28-32页
·离线规划的基本原理及存在的问题	第32-40页
·离线精确求解算法	第33-36页
·离线近似求解算法	第36-40页
·在线规划及受限通讯的一般解决方案	第40-44页
·在线协调机制	第40-42页
·在线通讯策略	第42-44页
·本章小结	第44-46页
第三章通讯受限的在线规划算法	第46-76页
·保证多智能体策略协调性的规划框架	第46-51页
·基于线性规划的快速在线策略求解	第51-55页
·基于策略相似性的历史信息归并	第55-60页
·基于信念一致性检测的通讯策略	第60-64页
·信念池结构的具体算法实现	第64-66页
·实验结果	第66-74页
·完全可靠通讯信道问题	第68-72页
·非可靠通讯信道问题	第72-74页
·本章小结	第74-76页
第四章有限资源离线规划算法	第76-98页
·基于信念状态的快速策略生成	第77-83页
·生成策略的问题描述	第77-79页
·子策略映射的近似求解	第79-82页
·算法的描述和复杂度分析	第82-83页
·基于测试反馈的近似策略评估	第83-89页
·信念状态生成	第83-85页
·策略的参数改进	第85-86页
·策略期望值评价	第86-88页
·算法的多线程实现	第88-89页
·实验结果	第89-96页
·基于信念点的策略生成算法实验	第89-93页
·基于测试的策略评价算法实验	第93-96页
·本章小结	第96-98页
第5章无模型的蒙特卡罗规划算法	第98-110页
·蒙特卡罗离线规划算法	第99-104页
·基于启发式策略的状态采样	第100-101页
·基于参数估计的策略改进	第101-103页
·算法复杂度分析	第103-104页
·实验结果	第104-107页
·标准测试集问题	第104-106页
·分布式传感器网络问题示例	第106-107页
·本章小结	第107-110页
第6章总结与展望	第110-116页
·工作总结	第110-114页
·前景展望	第114-116页
参考文献	第116-122页
第A章机器人足球问题简介	第122-124页
致谢	第124-126页
在读期间发表的学术论文与取得的研究成果	第126-127页