首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于分布式机器人体系结构的逆向增强学习技术

摘要第5-7页
Abstract第7-8页
目录第9-14页
第1章 绪论第14-23页
    1.1 研究背景与意义第14-15页
    1.2 国外研究现状第15-19页
        1.2.1 分布式智能模型第16-17页
        1.2.2 4D/RCS体系结构第17-19页
    1.3 国内研究现状第19-20页
    1.4 本文研究工作第20-21页
    1.5 内容安排第21-23页
第2章 分布式体系结构第23-44页
    2.1 多智能体模型第23-32页
        2.1.1 多智能体布局第24-25页
        2.1.2 智能体分类第25-27页
        2.1.3 多智能体结构第27-32页
    2.2 多智能体消息流第32-37页
        2.2.1 消息传递支撑平台第32-34页
        2.2.2 智能体数据流第34-36页
        2.2.3 事件和状态第36-37页
    2.3 实验第37-43页
        2.3.1 消息传递平台测试第37-40页
        2.3.2 实际环境中的系统运行测试第40-43页
    2.4 本章小结第43-44页
第3章 策略生成的学习架构第44-61页
    3.1 马尔可夫决策过程及相关模型第44-48页
        3.1.1 马尔可夫决策过程第44-46页
        3.1.2 基于马尔可夫决策过程的规划、行动和学习的集成第46-48页
    3.2 策略求解——增强学习第48-49页
    3.3 回报学习——逆增强学习第49-54页
        3.3.1 逆增强学习原理第52页
        3.3.2 逆增强学习算法第52-54页
        3.3.3 逆增强学习的进展第54页
    3.4 分布式架构下的逆增强学习第54-56页
        3.4.1 示教特征期望获取第55-56页
        3.4.2 回报估计第56页
    3.5 实验第56-60页
    3.6 本章小结第60-61页
第4章 回报特征的自动选择第61-78页
    4.1 回报特征降维第61-69页
        4.1.1 原理第61-62页
        4.1.2 经典的降维方法第62-68页
        4.1.3 回报特征降维算法第68-69页
    4.2 实验第69-77页
    4.3 本章小结第77-78页
第5章 总结与展望第78-80页
    5.1 总结第78页
    5.2 展望第78-80页
参考文献第80-86页
攻读硕士学位期间主要研究成果第86-87页
致谢第87页

论文共87页,点击 下载论文
上一篇:白菜花粉发育与授粉受精相关基因BcAHA8的表达分析及BcSKS11的功能鉴定
下一篇:热剪切应力传感器的研究