首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于SARSA算法的足球机器人决策系统的研究与设计

摘要第4-5页
ABSTRACT第5-6页
第1章 绪论第9-17页
    1.1 课题的研究背景和意义第9-10页
    1.2 国内外研究现状及分析第10-15页
        1.2.1 Robo Cup 2D研究现状第10-13页
        1.2.2 多智能体中强化学习的研究现状第13-15页
    1.3 本文主要研究内容第15-16页
    1.4 本文的章节安排第16-17页
第2章 足球机器人系统及强化学习算法的研究第17-31页
    2.1 引言第17页
    2.2 树形搜索的多智能体在线规划第17-22页
        2.2.1 合作动作模块第19页
        2.2.2 动作生成模块第19-20页
        2.2.3 评估模块第20页
        2.2.4 树形搜索算法第20-22页
    2.3 强化学习模型第22-30页
        2.3.1 马尔可夫过程第23-26页
        2.3.2 模型相关的强化学习算法第26-27页
        2.3.3 模型无关的强化学习算法第27-30页
    2.4 本章小结第30-31页
第3章 基于SARSA算法的足球机器人决策系统第31-43页
    3.1 引言第31-32页
    3.2 状态空间的划分与动作集的确定第32-34页
        3.2.1 状态空间的划分第32-33页
        3.2.2 动作集的确定第33-34页
        3.2.3 奖励函数第34页
    3.3 奖励修正函数的研究与设计第34-36页
        3.3.1 基于球队分散度的奖励修正第35-36页
        3.3.2 基于足球转移距离的奖励修正第36页
    3.4 共享Q表算法研究与设计第36-41页
        3.4.1 共享Q表算法的设计第38-40页
        3.4.2 基于最大Q值的融合算法第40-41页
    3.5 动作选择策略设计第41-42页
    3.6 本章小结第42-43页
第4章 实验平台介绍及实验结果分析第43-51页
    4.1 实验平台介绍第43-45页
    4.2 S ARS A算法学习收敛性实验结果分析第45-46页
    4.3 球队比赛实验结果分析第46-50页
        4.3.1 奖励函数对比赛结果的影响第46-47页
        4.3.2 奖励修正对比赛结果的影响与比较第47-48页
        4.3.3 其他球队的比赛结果与分析第48-50页
    4.4 本章小结第50-51页
结论第51-52页
参考文献第52-58页
攻读学位期间发表的学术论文第58-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:基于用户投资行为分析的金融知识服务研究与平台实现
下一篇:基于核聚类的半监督模型误定问题的研究