首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于决策理论的多智能体系统规划问题研究

摘要第1-7页
ABSTRACT第7-10页
目录第10-13页
表格第13-14页
插图第14-15页
算法第15-16页
主要符号对照表第16-18页
第一章 绪论第18-28页
   ·引言第18-19页
   ·不确定性环境下的决策与规划第19-22页
   ·多智能体系统的协调与合作第22-25页
   ·论文的内容与组织结构第25-28页
第二章 多智能体的马尔科夫决策模型第28-46页
   ·分布式局部可观察马尔科夫决策过程第28-32页
   ·离线规划的基本原理及存在的问题第32-40页
     ·离线精确求解算法第33-36页
     ·离线近似求解算法第36-40页
   ·在线规划及受限通讯的一般解决方案第40-44页
     ·在线协调机制第40-42页
     ·在线通讯策略第42-44页
   ·本章小结第44-46页
第三章 通讯受限的在线规划算法第46-76页
   ·保证多智能体策略协调性的规划框架第46-51页
   ·基于线性规划的快速在线策略求解第51-55页
   ·基于策略相似性的历史信息归并第55-60页
   ·基于信念一致性检测的通讯策略第60-64页
   ·信念池结构的具体算法实现第64-66页
   ·实验结果第66-74页
     ·完全可靠通讯信道问题第68-72页
     ·非可靠通讯信道问题第72-74页
   ·本章小结第74-76页
第四章 有限资源离线规划算法第76-98页
   ·基于信念状态的快速策略生成第77-83页
     ·生成策略的问题描述第77-79页
     ·子策略映射的近似求解第79-82页
     ·算法的描述和复杂度分析第82-83页
   ·基于测试反馈的近似策略评估第83-89页
     ·信念状态生成第83-85页
     ·策略的参数改进第85-86页
     ·策略期望值评价第86-88页
     ·算法的多线程实现第88-89页
   ·实验结果第89-96页
     ·基于信念点的策略生成算法实验第89-93页
     ·基于测试的策略评价算法实验第93-96页
   ·本章小结第96-98页
第5章 无模型的蒙特卡罗规划算法第98-110页
   ·蒙特卡罗离线规划算法第99-104页
     ·基于启发式策略的状态采样第100-101页
     ·基于参数估计的策略改进第101-103页
     ·算法复杂度分析第103-104页
   ·实验结果第104-107页
     ·标准测试集问题第104-106页
     ·分布式传感器网络问题示例第106-107页
   ·本章小结第107-110页
第6章 总结与展望第110-116页
   ·工作总结第110-114页
   ·前景展望第114-116页
参考文献第116-122页
第A章 机器人足球问题简介第122-124页
致谢第124-126页
在读期间发表的学术论文与取得的研究成果第126-127页

论文共127页,点击 下载论文
上一篇:盗版行为中的利己主义与利他主义--一个基于心理冲突的双决策模型
下一篇:高灵敏微悬臂梁探针设计制作及特性研究