首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

机器学习算法及其应用研究

摘要第5-6页
Abstract第6页
第1章 绪论第11-18页
    1.1 增强学习的历史与发展第12-13页
    1.2 机器人足球比赛的起源及发展第13-15页
        1.2.1 FIRA简介第13-14页
        1.2.2 RoboCup的发展第14-15页
    1.3 机器人足球仿真的研究现状第15-16页
    1.4 机器人足球研究的目的与意义第16-17页
    1.5 本文研究的主要内容第17-18页
第2章 增强学习模型算法研究第18-26页
    2.1 增强学习的基本原理和模型第18-21页
        2.1.1 基本原理第18页
        2.1.2 增强学习模型第18-21页
        2.1.3 马尔科夫决策进程(MDPs)第21页
    2.2 增强学习的几种经典算法第21-24页
        2.2.1 瞬时差分学习TD第21-22页
        2.2.2 Q-Learning算法第22-23页
        2.2.3 SARSA学习算法第23页
        2.2.4 一种改进的SARSA学习算法第23-24页
    2.3 增强学习的主要应用第24-25页
    2.4 本章小结第25-26页
第3章 MSRS 11vs11足球机器人比赛平台第26-32页
    3.1 机器人足球系统简介第26-27页
        3.1.1 足球机器人子系统第27页
        3.1.2 视觉子系统第27页
        3.1.3 决策子系统第27页
        3.1.4 无线通讯子系统第27页
    3.2 足球机器人仿真平台第27-31页
        3.2.1 MSRS仿真平台简介第28页
        3.2.2 MSRS仿真平台的结构第28-29页
        3.2.3 MSRS仿真平台模式第29-30页
        3.2.4 比赛场地环境第30-31页
    3.3 本章小结第31-32页
第4章 改进SARSA学习算法在智能体中的应用研究第32-50页
    4.1 改进SARSA学习算法在单智能体对抗中的应用第32-43页
        4.1.1 仿真环境的离散化及基本动作设置第32-34页
        4.1.2 基于混合贪婪算法的Q值更新及动作选择第34-36页
        4.1.3 改进SARSA学习算法的奖赏函数的设置第36页
        4.1.4 仿真实验数据分析第36-43页
    4.2 改进SARSA学习算法在多智能体中的应用第43-49页
        4.2.1 任务描述第43-44页
        4.2.2 多智能体基本动作设计第44-46页
        4.2.3 智能体角色及其动态调整第46-47页
        4.2.4 奖赏函数的设定第47页
        4.2.5 仿真实验数据分析第47-49页
    4.3 本章小结第49-50页
结论第50-53页
参考文献第53-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:两层传感器网络中的安全Top-k查询协议研究
下一篇:敏捷地产采购管理优化研究