首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

多智能体深度强化学习方法及应用研究

摘要第5-7页
ABSTRACT第7-8页
符号对照表第12-13页
缩略语对照表第13-18页
第一章 绪论第18-28页
    1.1 研究背景与意义第18-20页
    1.2 多智能体深度强化学习的研究进展第20-24页
        1.2.1 发展历程与现状第20-22页
        1.2.2 应用场景第22-24页
    1.3 课题来源及主要贡献第24-25页
    1.4 论文结构与章节安排第25-28页
第二章 多智能体深度强化学习简介第28-46页
    2.1 机器学习与强化学习第28-33页
    2.2 深度学习第33-37页
    2.3 多智能体深度强化学习第37-41页
        2.3.1 深度强化学习第37-39页
        2.3.2 多智能体系统与多智能体强化学习第39-41页
    2.4 博弈论与强化学习第41-42页
    2.5 计算经济学与市场模型第42-43页
    2.6 本章小结第43-46页
第三章 定制化数据挖掘与智能体的生成式模型构建第46-58页
    3.1 定制化数据挖掘与推荐系统第46-48页
    3.2 集中式多智能体深度强化学习框架第48-50页
    3.3 用户模式的生成式模型第50-51页
    3.4 市场模型与价格框架第51-53页
    3.5 基于强化学习的用户模式学习第53-54页
    3.6 实验仿真与分析第54-56页
    3.7 本章小结第56-58页
第四章 同类智能体的社交行为学习方法第58-70页
    4.1 用户模式及社交特征第58-60页
    4.2 同类智能体的市场模型第60-63页
        4.2.1 囚徒窘境第61-62页
        4.2.2 古诺模型第62-63页
    4.3 基于强化学习的社交行为学习第63-65页
    4.4 实验仿真与分析第65-69页
    4.5 本章小结第69-70页
第五章 异类智能体的交互与动态资源分配算法第70-86页
    5.1 异类多智能体系统和垄断型市场第70-72页
    5.2 异类多智能体强化学习第72-75页
        5.2.1 认知用户行为第73-74页
        5.2.2 授权用户行为第74-75页
    5.3 基于垄断型市场环境的强化学习第75-79页
        5.3.1 认知用户学习与二阶概率Q学习第76-78页
        5.3.2 授权用户学习与双向强化学习第78-79页
    5.4 实验仿真与分析第79-84页
    5.5 本章小结第84-86页
第六章 复杂多智能体系统应用:社交车辆种群第86-102页
    6.1 社交车辆种群架构第86-90页
        6.1.1 U2V通信第88页
        6.1.2 U2I通信第88-89页
        6.1.3 V2V通信第89-90页
    6.2 基于社交车辆种群的方法和技术第90-92页
        6.2.1 隐私保护大数据挖掘第90-91页
        6.2.2 深度强化学习第91-92页
        6.2.3 亚云计算第92页
    6.3 基于SVS环境的多摄像头联动车辆追踪方法第92-101页
        6.3.1 基于ColorFasterR-CNN的车辆检测方法第93-94页
        6.3.2 基于卡尔曼滤波器的速度估计方法第94-95页
        6.3.3 基于深度学习的数据融合第95页
        6.3.4 实验仿真与分析第95-97页
        6.3.5 定制化车辆检测方法第97-101页
    6.4 本章小结第101-102页
第七章 总结与展望第102-106页
参考文献第106-116页
致谢第116-118页
作者简介第118-120页

论文共120页,点击 下载论文
上一篇:基于深度学习的高光谱图像超分辨处理方法研究
下一篇:进化多目标优化算法研究及其应用