首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于DQN的主动人员感知与定位技术研究

摘要第10-12页
ABSTRACT第12-13页
第1章 绪论第14-24页
    1.1 课题背景与研究意义第14-16页
        1.1.1 课题背景第14-15页
        1.1.2 研究意义第15-16页
    1.2 国内外研究现状第16-21页
        1.2.1 人员感知与定位技术现状第16-17页
        1.2.2 基于视觉的人员感知与定位技术现状第17-21页
    1.3 本文主要工作第21-22页
    1.4 论文结构第22-24页
第2章 基于DQN人员感知与定位的理论研究第24-34页
    2.1 人员感知的卷积网络模型第24-27页
        2.1.1 局部感知原理第24-25页
        2.1.2 网络权值共享第25-26页
        2.1.3 池化作用第26-27页
    2.2 人员定位的强化决策原理第27-30页
        2.2.1 马尔科夫决策过程第28-29页
        2.2.2 值函数估计第29页
        2.2.3 Q学习第29-30页
    2.3 DQN算法原理第30-32页
    2.4 本章小结第32-34页
第3章 主动人员感知与定位的系统建模第34-46页
    3.1 人员感知与定位系统的总体设计第34-35页
    3.2 人员感知与定位的模型设计第35-37页
        3.2.1 环境状态的模型设计第35-37页
        3.2.2 系统的马尔科夫建模第37页
    3.3 智能体的动作设计第37-39页
        3.3.1 动作维度设计第37-38页
        3.3.2 感知范围约束第38-39页
    3.4 目标状态的检验标准第39-42页
        3.4.1 人员检测器模型第39-41页
        3.4.2 检测器模型优化第41-42页
    3.5 回报函数设计第42-44页
    3.6 本章小结第44-46页
第4章 主动人员感知与定位的算法实现第46-58页
    4.1 人员感知定位的决策网络设计第46-50页
        4.1.1 卷积网络层设计第46-47页
        4.1.2 全连接层的竞争架构设计第47-49页
        4.1.3 实验测试与分析第49-50页
    4.2 主动视觉感知的优化模型第50-54页
        4.2.1 决策网络的训练目标第50-51页
        4.2.2 网络权值的更新策略第51-53页
        4.2.3 实验测试与分析第53-54页
    4.3 算法程序的设计与实现第54-57页
        4.3.1 经验样本的学习策略第54页
        4.3.2 训练程序的总体设计第54-56页
        4.3.3 基于Tensorflow的编程实现第56-57页
    4.4 本章小结第57-58页
第5章 Gazebo环境仿真实验第58-70页
    5.1 实验方案第58-59页
        5.1.1 总体设计第58页
        5.1.2 运行平台配置第58-59页
    5.2 仿真平台系统搭建第59-63页
        5.2.1 环境模型第59-60页
        5.2.2 智能体模型第60-61页
        5.2.3 机器人ROS通信第61-63页
    5.3 仿真验证与分析第63-68页
        5.3.1 训练阶段仿真分析第63-65页
        5.3.2 测试阶段仿真分析第65-68页
        5.3.3 仿真效果演示第68页
    5.4 本章小结第68-70页
第6章 总结与展望第70-72页
    6.1 总结第70-71页
    6.2 展望第71-72页
参考文献第72-78页
致谢第78-80页
攻读硕士期间参与的项目与主要成果第80-81页
学位论文评阅及答辩情况表第81页

论文共81页,点击 下载论文
上一篇:含蜡油在磁场及防蜡剂中防蜡降粘实验研究
下一篇:基于模型驱动的海洋油气作业虚拟仿真开发方法研究