首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于深度学习的视频语义描述的研究与实现

摘要第4-5页
abstract第5页
专用术语注释表第8-9页
第一章 绪论第9-12页
    1.1 课题研究背景及意义第9-10页
    1.2 课题来源与组织结构第10-12页
第二章 相关技术研究第12-22页
    2.1 深度学习概述第12-17页
        2.1.1 反向传播算法第12-15页
        2.1.2 卷积神经网络第15-16页
        2.1.3 LSTM第16-17页
    2.2 基于无监督和自监督的视频帧间特征学习研究现状第17-19页
    2.3 基于深度学习的视频语义描述的研究现状第19-21页
    2.4 本章小结第21-22页
第三章 基于深度学习的视频语义描述系统总体设计第22-30页
    3.1 设计目标第22-24页
        3.1.1 系统功能需求第22-24页
        3.1.2 系统性能要求第24页
    3.2 系统总体设计第24-27页
        3.2.1 系统功能设计第25-27页
        3.2.2 系统处理流程第27页
    3.3 系统架构第27-29页
    3.4 本章小结第29-30页
第四章 基于3D卷积的视频错帧筛选方法第30-41页
    4.1 顺序验证模型概述第30-32页
    4.2 改进的顺序验证模型——错帧筛选模型第32-33页
    4.3 视频帧采样第33-36页
        4.3.1 帧融合第34页
        4.3.2 色彩流第34-35页
        4.3.3 运动流第35页
        4.3.4 关键帧提取第35-36页
        4.3.5 多分流结构模型第36页
    4.4 视频帧编码第36-37页
    4.5 实验分析第37-40页
        4.5.1 数据集第37-38页
        4.5.2 实验结果第38-40页
    4.6 本章小结第40-41页
第五章 基于LSTM的视频语义描述实现机制第41-52页
    5.1 超帧分割第41-42页
    5.2 视频语义描述模型第42-46页
        5.2.1 传统端到端的视频语义描述模型第42-44页
        5.2.2 改进的端到端视频语义描述模型第44-46页
    5.3 文本摘要第46-49页
        5.3.1 摘要度量标准第48-49页
    5.4 实验分析第49-51页
        5.4.1 数据集第49页
        5.4.2 实验结果第49-51页
    5.5 本章小结第51-52页
第六章 系统测试第52-63页
    6.1 测试需求第52页
    6.2 测试环境第52-56页
        6.2.1 软、硬件环境第53页
        6.2.2 系统搭建第53-56页
    6.3 系统功能测试第56-62页
        6.3.1 软件启动第56页
        6.3.2 文件选择第56-58页
        6.3.3 实时检测第58-59页
        6.3.4 目标识别第59-60页
        6.3.5 视频语义描述第60-62页
    6.4 本章小结第62-63页
第七章 总结与展望第63-65页
    7.1 总结第63-64页
    7.2 展望第64-65页
参考文献第65-69页
附录1 攻读硕士学位期间撰写的论文第69-70页
附录2 攻读硕士学位期间申请的专利第70-71页
附录3 攻读硕士学位期间参加的科研项目第71-72页
致谢第72页

论文共72页,点击 下载论文
上一篇:基于卷积神经网络的苹果表面伤疤识别研究
下一篇:基于WiFi和惯性传感器室内融合定位研究