多智能体系统协作模型及其在足球机器人仿真系统中的应用

第一章绪论	第1-23页
1．1 研究背景及目的意义	第11-17页
1．1．1 多智能体系统的协作	第11-15页
1．1．2 足球机器人仿真系统	第15-16页
1．1．3 研究的目的及意义	第16-17页
1．2 国内外研究现状	第17-20页
1．2．1 理性智能体的BDI模型	第17-18页
1．2．2 规划协作模型	第18页
1．2．3 基于学习的自协调模型	第18-20页
1．3 主要研究内容与基本思想	第20-21页
1．4 论文构成	第21-23页
第二章多智能体系统协作模型的总体框架	第23-37页
2．1 RoboCup仿真系统	第23-28页
2．1．1 仿真环境	第23-24页
2．1．2 设计难点	第24-25页
2．1．3 仿真球队的设计	第25-28页
2．2 RoboCup仿真系统的主要协作问题	第28-29页
2．3 实现多智能体协作的关键技术	第29-31页
2．4 多智能体系统协作模型的总体框架	第31-36页
2．5 小结	第36-37页
第三章基于状态和合作意愿的规划协作	第37-52页
3．1 基于状态的规划协作模型	第37-40页
3．1．1 状态规划	第38页
3．1．2 协作模型	第38-39页
3．1．3 SBPC的三要素	第39-40页
3．2 SBPC模型在Robocup中的应用	第40-43页
3．3 基于合作意愿矩阵的规划协作策略	第43-49页
3．3．1 几种传球方法的比较	第44-46页
3．3．2 基于合作意愿矩阵的规划协作策略	第46-49页
3．4 规划协作策略在RoboCup中的应用	第49-51页
3．5 小结	第51-52页
第四章基于阵形变换和亲密度的动态协作	第52-70页
4．1 角色和阵形	第52-56页
4．1．1 角色	第52-53页
4．1．2 阵形	第53-56页
4．2 基于阵形变换的动态防守协作模型	第56-61页
4．2．1 模型的结构	第56-59页
4．2．2 阵形变换模块	第59-60页
4．2．3 动态防守协作模型在RoboCup中的应用	第60-61页
4．3 亲密度模型的建立	第61-64页
4．3．1 足球比赛中防守战术分析	第61-63页
4．3．2 亲密度模型	第63-64页
4．4 亲密度模型在RoboCup动态防守协作中的应用	第64-68页
4．4．1 基于亲密度模型的人盯人动态防守协作策略	第64-65页
4．4．2 基于亲密度模型的区域动态防守协作策略	第65-68页
4．5 小结	第68-70页
第五章多智能体协作策略的统计Q学习	第70-87页
5．1 多智能体增强学习	第70-72页
5．1．1 增强学习	第70-71页
5．1．2 多智能体增强学习	第71-72页
5．2 多智能体O学习	第72-74页
5．2．1 增强Q学习	第72-73页
5．2．2 多智能体Q学习模型	第73-74页
5．3 基于统计的多智能体Q学习	第74-82页
5．3．1 统计多智能体Q学习	第74-76页
5．3．2 统计多智能体Q学习算法	第76-77页
5．3．3 算法收敛性证明	第77-81页
5．3．4 算法有效性分析	第81-82页
5．4 RoboCup中协作策略的学习	第82-86页
5．4．1 防守协作策略的离线学习	第83-84页
5．4．2 算法性能分析	第84-86页
5．5 小结	第86-87页
第六章基于预测的多智能体协作模型	第87-101页
6．1 基于行为预测的多智能体协作模型	第87-92页
6．1．1 智能体行为预测的方法	第87-89页
6．1．2 基于行为预测的协作模型	第89-90页
6．1．3 预测协作模型在RoboCup中的应用	第90-92页
6．2 基于预测的多智能体Q学习	第92-98页
6．2．1 预测Q学习的引入	第93-94页
6．2．2 多智能体预测Q学习模型	第94-97页
6．2．3 学习性能分析	第97-98页
6．3 高层协作策略的预测Q学习	第98-100页
6．3．1 前场对抗与协作策略的学习	第98-99页
6．3．2 算法性能分析	第99-100页
6．4 小结	第100-101页
第七章结论与展望	第101-104页
7．1 结论	第101-103页
7．2 展望	第103-104页
参考文献	第104-113页
图索引	第113-114页
表索引	第114-115页
致谢	第115-116页
攻读学位期间主要的研究成果目录	第116页