基于价值的机器学习方法及其在RoboCup仿真2D中的应用
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-7页 |
| 致谢 | 第7-11页 |
| 第一章 绪论 | 第11-15页 |
| ·智能Agent | 第11-12页 |
| ·多Agent系统(MAS) | 第12-13页 |
| ·本文的组织安排 | 第13-15页 |
| ·课题来源 | 第13-14页 |
| ·本文组织 | 第14-15页 |
| 第二章 HfutEngine2D设计的相关介绍 | 第15-22页 |
| ·RoboCup简介 | 第15-16页 |
| ·HfutEngine2D简介 | 第16页 |
| ·HfutEngine2D高层决策部分的整体结构 | 第16-17页 |
| ·球队编码的方式——手工编码及学习算法 | 第17-22页 |
| ·两种编码方式的比较 | 第17-19页 |
| ·两种方法在球队设计中的具体应用 | 第19-22页 |
| ·迭代法 | 第19页 |
| ·公式法 | 第19-20页 |
| ·采用学习的方法 | 第20-22页 |
| 第三章 基于价值的学习方法 | 第22-32页 |
| ·价值学习的意义 | 第22页 |
| ·价值观的提出 | 第22-26页 |
| ·基于价值的学习方法在传球对象选择方面的应用 | 第26-31页 |
| ·本章小结 | 第31-32页 |
| 第四章 一种基于无关区域排除的目标跟踪方法 | 第32-40页 |
| ·引言 | 第32页 |
| ·各种跟踪方法介绍 | 第32-39页 |
| ·直接跟踪 | 第32-33页 |
| ·加上可信度的目标跟踪 | 第33-34页 |
| ·带有预测的目标跟踪 | 第34页 |
| ·目标行为预测法 | 第34页 |
| ·基于位置概率的目标跟踪 | 第34-36页 |
| ·带有无关区域排除法的目标跟踪 | 第36-39页 |
| ·本章小结 | 第39-40页 |
| 第五章 RoboCup2D视觉决策 | 第40-56页 |
| ·RoboCup2D的视觉模型介绍 | 第40-45页 |
| ·区域可信度的重要性 | 第45-46页 |
| ·结合基于价值的学习方法 | 第46-51页 |
| ·以前所采用的方法 | 第46-50页 |
| ·基于价值的视觉方式 | 第50-51页 |
| ·实验结果与总结 | 第51-54页 |
| ·本章小结 | 第54-56页 |
| 第六章 结论与展望 | 第56-58页 |
| ·工作总结 | 第56页 |
| ·未来工作展望 | 第56-58页 |
| 参考文献 | 第58-62页 |
| 附录1:作者在攻读硕士期间发表的论文 | 第62页 |
| 附录2:HfutEngine2D的历史成绩 | 第62页 |