摘要 | 第1-4页 |
ABSTRACT | 第4-8页 |
第一章 绪论 | 第8-13页 |
·研究背景与研究意义 | 第8-9页 |
·国内外研究现状 | 第9-12页 |
·论文主要内容及构成 | 第12-13页 |
第二章 足球机器人系统 | 第13-23页 |
·实物足球机器人比赛系统 | 第13-15页 |
·足球机器人仿真比赛系统 | 第15-22页 |
·Robot Soccer v1.5a仿真平台介绍 | 第16页 |
·5vs5仿真平台的运动模型 | 第16-20页 |
·基于Robot Soccer v1.5a编程开发的向导 | 第20-22页 |
·小结 | 第22-23页 |
第三章 决策系统总体结构及其强化学习算法 | 第23-35页 |
·决策系统设计要求 | 第23-24页 |
·决策系统总体结构 | 第24-25页 |
·下层智能体结构的选择 | 第25-29页 |
·Agent的定义 | 第26页 |
·Agent的体系结构 | 第26-29页 |
·协调层强化学习算法选择 | 第29-34页 |
·强化学习概念和原理 | 第29-30页 |
·强化学习系统的组成要素 | 第30-31页 |
·强化学习分类 | 第31-32页 |
·TD学习算法 | 第32页 |
·Q学习算法 | 第32-34页 |
·小结 | 第34-35页 |
第四章 基于改进Q学习的决策算法 | 第35-57页 |
·决策方式 | 第35-37页 |
·Q学习算法改进 | 第37-40页 |
·基于改进Q学习的协调层设计 | 第40-48页 |
·基于Q学习的策略选择模块 | 第41-46页 |
·角色分配模块的设计 | 第46-48页 |
·运动控制层设计 | 第48-56页 |
·小结 | 第56-57页 |
第五章 软件实现与效果分析 | 第57-64页 |
·软件设计目标 | 第57页 |
·软件设计 | 第57-61页 |
·仿真实验与分析 | 第61-63页 |
·小结 | 第63-64页 |
第六章 结论与展望 | 第64-67页 |
·结论 | 第64-65页 |
·展望 | 第65-67页 |
参考文献 | 第67-72页 |
致谢 | 第72-73页 |
攻读学位期间主要的研究成果 | 第73页 |