首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于智能体的多机器人系统学习方法研究

摘要第4-6页
Abstract第6-7页
第1章 绪论第15-35页
    1.1 课题研究背景及意义第15-17页
    1.2 智能体及多智能体系统理论第17-19页
    1.3 多机器人系统研究内容综述第19-25页
        1.3.1 多机器人系统的主要研究内容第19-22页
        1.3.2 多机器人系统的国内外研究现状第22-24页
        1.3.3 多机器人系统的应用平台第24-25页
    1.4 机器学习方法第25-32页
        1.4.1 机器学习的发展历史和分类第25-30页
        1.4.2 机器学习在多机器人系统中的应用现状第30-32页
    1.5 本文的主要研究思路和内容安排第32-35页
        1.5.1 研究思路第32-33页
        1.5.2 本文的内容安排第33-35页
第2章 基于行为的多机器人编队和足球系统第35-57页
    2.1 引言第35页
    2.2 机器人体系结构第35-41页
        2.2.1 单机器人体系结构第35-38页
        2.2.2 多机器人体系结构第38-41页
    2.3 基于行为的多机器人编队系统第41-47页
        2.3.1 多机器人编队控制方法第41-42页
        2.3.2 基于行为的机器人编队行为设计第42-47页
    2.4 基于行为的机器人足球第47-52页
    2.5 机器人仿真环境第52-56页
    2.6 本章小结第56-57页
第3章 融合PSO和CBR的行为参数优化方法第57-81页
    3.1 引言第57页
    3.2 粒子群优化算法第57-63页
        3.2.1 PSO算法流程及收敛性分析第58-61页
        3.2.2 PSO算法与GA算法比较及发展趋势第61-63页
    3.3 基于案例的推理方法第63-69页
        3.3.1 CBR的起源及研究现状第63-64页
        3.3.2 CBR的基本原理及发展趋势第64-69页
    3.4 融合PSO与CBR的混合系统第69-76页
        3.4.1 融合PSO的CBR流程第72-74页
        3.4.2 基于CBR的PSO算法第74-76页
    3.5 仿真实验第76-80页
    3.6 本章小结第80-81页
第4章 基于经验共享和滤波技术的改进Q-学习算法第81-106页
    4.1 引言第81页
    4.2 强化学习原理及Q-学习算法第81-92页
    4.3 采用经验共享的Q-学习第92-96页
    4.4 利用卡尔曼滤波解决结构信度分配问题第96-100页
        4.4.1 卡尔曼滤波算法第96-98页
        4.4.2 对整体回报信号进行估计第98-100页
    4.5 仿真实验第100-105页
    4.6 本章小结第105-106页
第5章 基于无悔策略的多智能体强化学习算法第106-129页
    5.1 引言第106页
    5.2 马尔可夫对策的解概念及均衡的分类第106-111页
    5.3 多智能体强化学习分类第111-118页
    5.4 基于无悔理论的学习方法第118-121页
        5.4.1 后悔与决策的关系第118页
        5.4.2 基于减少后悔值的无悔学习方法第118-121页
    5.5 基于减少平均后悔值的CE-Q学习算法第121-124页
    5.6 仿真实验第124-128页
    5.7 本章小结第128-129页
结论第129-131页
参考文献第131-142页
攻读学位期间发表的学术论文第142-145页
致谢第145-146页
个人简历第146页

论文共146页,点击 下载论文
上一篇:环保非政府组织参与环境群体性事件治理研究--以浙江晶科环境群体性事件为例
下一篇:吸烟饮酒对健康风险的影响分析及政策建议--基于社会经济地位的视角