首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于多智能体强化学习的足球机器人决策系统研究与设计

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-16页
    1.1 课题背景第9-10页
    1.2 课题的研究目的和意义第10-11页
    1.3 国内外研究现状分析第11-13页
    1.4 本文主要研究工作第13-14页
    1.5 本文的结构第14-16页
第2章 多智能体强化学习模型及算法第16-26页
    2.1 强化学习模型第16-19页
        2.1.1 马尔可夫决策模型第16-18页
        2.1.2 回报函数与策略求解第18-19页
    2.2 强化学习主要算法第19-22页
        2.2.1 TD 学习算法第19-20页
        2.2.2 Q 学习算法第20-22页
    2.3 多智能体强化学习第22-25页
        2.3.1 多智能体系统特点第22-23页
        2.3.2 多智能体强化学习方法第23-25页
    2.5 本章小结第25-26页
第3章 基于 Q 学习的足球机器人决策系统第26-42页
    3.1 Q 学习方法调整第26-30页
        3.1.1 基于 CMAC 网络的 Q 学习泛化第26-28页
        3.1.2 基于模拟退火的搜索策略第28-30页
    3.2 基于 MAXQ 分层学习的模型与算法第30-37页
        3.2.1 分层学习结构第30-31页
        3.2.2 MAXQ 分层学习算法优化第31-37页
    3.3 基于 MAXQ 的足球机器人研究第37-41页
        3.3.1 实验平台简介及分析第37-38页
        3.3.2 球员任务划分第38-40页
        3.3.3 球员强化学习过程示例第40-41页
    3.4 本章小结第41-42页
第4章 足球机器人决策系统设计及实验分析第42-55页
    4.1 球队设计第42-44页
        4.1.1 球队模型第42-43页
        4.1.2 动态场区评价模型第43-44页
    4.2 球员协作进攻决策的设计第44-50页
        4.2.1 节点动作模块第45页
        4.2.2 协作动作模块第45-46页
        4.2.3 联合树搜索过程第46-47页
        4.2.4 估值算法第47-50页
    4.3 实验结果分析第50-54页
        4.3.1 学习算法比较第50-51页
        4.3.2 球队比赛分析第51-54页
    4.4 本章小结第54-55页
结论第55-57页
参考文献第57-61页
攻读学位期间发表的学术论文第61-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:冗余机械臂单关节故障下的建模与容错控制研究
下一篇:基于JSP的艺术院校图书管理系统的设计与实现