首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于深度学习的视频人体动作识别

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第11-19页
    1.1 选题背景和意义第11-13页
    1.2 国内外研究现状第13-18页
        1.2.1 视频动作识别数据集的演变第14-16页
        1.2.2 基于手工设计特征的人体动作识别第16-17页
        1.2.3 基于深度学习的人体动作识别第17-18页
    1.3 本文创新点和结构安排第18-19页
第2章 基于语义注意力模型的视频人体动作识别第19-33页
    2.1 背景介绍第19-22页
    2.2 相关工作第22-24页
    2.3 视频上下文信息获取第24-26页
        2.3.1 获取视频中运动主体的边界框第24-25页
        2.3.2 获取视频中运动主体周围物体的边界候选框第25页
        2.3.3 获取视频中运动主体周围物体的边界框第25-26页
    2.4 包含上下文信息的卷积网络结构第26-28页
        2.4.1 网络框架第26-27页
        2.4.2 加入上下文信息到网络中第27页
        2.4.3 特征融合第27-28页
    2.5 实验结果第28-32页
        2.5.1 网络参数说明第28-29页
        2.5.2 不同参数下的实验对比第29-31页
        2.5.3 和现有方法对比第31-32页
        2.5.4 本方法的优点和缺点第32页
    2.6 本章小结第32-33页
第3章 用于视频动作识别的视觉属性增强3D卷积第33-43页
    3.1 背景介绍第33-35页
    3.2 相关工作第35-36页
    3.3 视觉属性增强3D卷积第36-38页
        3.3.1 视觉属性的发现和识别第36-37页
        3.3.2 改进后的I3D结构第37页
        3.3.3 A3D整体结构第37-38页
    3.4 实验结果第38-41页
        3.4.1 数据集介绍第39页
        3.4.2 特征融合实验结果第39页
        3.4.3 时间开销和性能分析第39-41页
    3.5 本章小结第41-43页
第4章 基于泛化的注意力池化模型的动作识别第43-51页
    4.1 背景介绍第43-44页
    4.2 相关工作第44页
    4.3 泛化的注意力池化模型第44-47页
        4.3.1 公式推导第44-46页
        4.3.2 网络模型结构第46-47页
    4.4 实验结果第47-49页
        4.4.1 数据集说明第47页
        4.4.2 模型参数分析第47-48页
        4.4.3 实验性能对比与讨论第48-49页
    4.5 本章小结第49-51页
第5章 总结与展望第51-55页
    5.1 本文工作总结第51-53页
        5.1.1 基于语义注意力模型的视频动作识别第51-52页
        5.1.2 用于视频动作识别的视觉属性增强3D卷积神经网络第52页
        5.1.3 基于泛化的注意力池化模型的动作识别第52-53页
    5.2 未来工作展望第53-55页
参考文献第55-59页
致谢第59-61页
在读期间发表的学术论文与取得的研究成果第61页

论文共61页,点击 下载论文
上一篇:四硫代钼酸铵抑制顺铂与人铜伴侣蛋白Atoxl的相互作用
下一篇:基于遥感数据的建设用地提取及动态变化研究