首页--工业技术论文--无线电电子学、电信技术论文--电视论文--电视中心、电视设备论文--电视中心管理系统论文

面向视频监控场景的目标空间结构语义感知

摘要第5-6页
Abstract第6-7页
缩写、符号清单、术语表第12-16页
1 绪论第16-26页
    1.1 研究背景和研究意义第16-20页
    1.2 本文解决思路和研究框架第20-22页
    1.3 研究内容和主要贡献第22-24页
        1.3.1 多人姿态估计第23页
        1.3.2 行人重识别第23-24页
        1.3.3 行人搜索第24页
    1.4 论文组织结构第24-26页
2 国内外研究现状和发展态势第26-34页
    2.1 国内外研究现状第26-30页
        2.1.1 图像的特征表达第26-27页
        2.1.2 多人姿态估计第27-29页
        2.1.3 行人重识别第29-30页
        2.1.4 行人搜索第30页
    2.2 相关工作不足分析第30-31页
    2.3 发展态势第31-34页
3 基于全局感知的人体结构表达的多人姿态估计方法第34-49页
    3.1 问题概述第34-36页
    3.2 人物目标检测第36页
    3.3 基于全局结构感知的姿态估计第36-41页
        3.3.1 多尺度U型网络第37-38页
        3.3.2 使用Negative-OKS损失函数的多任务定位目标第38-40页
        3.3.3 使用加权直方图计算关键点位置第40页
        3.3.4 后处理中的加权OKS-NMS第40-41页
    3.4 实验结果第41-48页
        3.4.1 实验设置第41-42页
        3.4.2 评价指标第42-43页
        3.4.3 和近几年最好方法比较第43-45页
        3.4.4 对比实验第45-48页
    3.5 本章小结第48-49页
4 基于深度对应结构学习的行人重识别方法第49-61页
    4.1 问题概述第49-51页
    4.2 深度对应结构学习第51-55页
        4.2.1 问题定义第51-52页
        4.2.2 语义感知的图像表达第52页
        4.2.3 基于相关结构学习的图像匹配第52-54页
        4.2.4 统一的深度对应结构学习网络第54-55页
    4.3 实验结果第55-60页
        4.3.1 数据集第56-57页
        4.3.2 网络训练第57页
        4.3.3 实验结果第57-60页
    4.4 本章小结第60-61页
5 基于键-值记忆网络和联合注意力匹配的行人重识别方法第61-73页
    5.1 问题概述第61-63页
    5.2 键-值记忆匹配网络第63-66页
        5.2.1 位置感知的键-值记忆表达第63-64页
        5.2.2 基于多头联合注意力的稠密匹配第64-66页
        5.2.3 使用匹配网络进行相似度学习第66页
    5.3 实验结果第66-72页
        5.3.1 数据集第66-67页
        5.3.2 网络训练第67-68页
        5.3.3 整体性能第68-71页
        5.3.4 对比实验第71-72页
    5.4 本章小结第72-73页
6 基于知识蒸馏的高效行人搜索方法第73-91页
    6.1 问题概述第73-75页
    6.2 从专家网络进行知识蒸馏第75-78页
    6.3 基于空间结构知识蒸馏的行人搜索模型第78-80页
    6.4 实验结果第80-90页
        6.4.1 实验设置第80-81页
        6.4.2 网络训练第81-83页
        6.4.3 行人搜索模型比较第83-86页
        6.4.4 对比实验第86-89页
        6.4.5 行人搜索问题影响因素实验第89-90页
    6.5 本章小结第90-91页
7 总结与展望第91-95页
    7.1 本文工作总结第91-93页
    7.2 未来工作展望第93-95页
参考文献第95-102页
作者简历第102-104页
攻读博士学位期间主要的学术成果第104-106页
致谢第106页

论文共106页,点击 下载论文
上一篇:基于PyroSim的火灾人员疏散模型研究
下一篇:岩土介质渗流与传热特性的宏细观机理研究