首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于时空融合的多媒体事件检测

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第10-15页
    1.1 研究背景及意义第10-11页
    1.2 研究现状第11-13页
    1.3 论文内容及章节安排第13-15页
第二章 多媒体事件检测框架第15-19页
    2.1 当前主流框架第15-16页
        2.1.1 基于语义表达的多媒体事件检测第15页
        2.1.2 基于平均帧方法的多媒体事件检测第15-16页
    2.2 基于时空融合的多媒体事件检测框架第16-17页
    2.3 优势与创新点第17-19页
        2.3.1 框架优势第17-18页
        2.3.2 创新点第18-19页
第三章 基于深度网络的特征提取第19-40页
    3.1 DT/IDT特征第19-24页
        3.1.1 光流图的计算第19-20页
        3.1.2 轨迹跟踪第20页
        3.1.3 轨迹特征计算第20-21页
        3.1.4 IDT与CNN对比实验第21-24页
    3.2 基于CNN的密集局部特征第24-32页
        3.2.1 卷积神经网络第24-25页
        3.2.2 CNN特征图响应机制第25-26页
        3.2.3 图像与网络尺寸的适配第26-27页
        3.2.4 密集局部特征第27-28页
        3.2.5 网络模型对比实验第28-29页
        3.2.6 帧预处理技巧对比实验第29-31页
        3.2.7 优化策略第31-32页
    3.3 基于CNN的显著区域特征第32-40页
        3.3.1 显著性思想第32-33页
        3.3.2 Iception结构第33页
        3.3.3 RPN网络第33-34页
        3.3.4 显著区域特征提取第34-37页
        3.3.5 显著区域特征提取与其他方法的对比实验第37-40页
第四章 多媒体事件的时空表示第40-69页
    4.1 VLAD第40-53页
        4.1.1 BOVW模型第40-41页
        4.1.2 Fisher Vector模型第41-43页
        4.1.3 VLAD计算第43-45页
        4.1.4 k近邻软分配VLAD第45页
        4.1.5 最大主成分分析(PCA)第45-48页
        4.1.6 归一化第48-49页
        4.1.7 基于VLAD的多媒体事件的时空表示第49-50页
        4.1.8 帧级别特征预处理实验第50-51页
        4.1.9 k近邻软分配与原始VLAD对比实验第51-52页
        4.1.10 聚类中心数对比实验第52页
        4.1.11 VLAD与Fisher Vector的对比实验第52-53页
    4.2 长短时间记忆单元(LSTM)第53-59页
        4.2.1 循环神经网络(RNN)模型第53-57页
        4.2.2 基于LSTM的多媒体事件的时空表示第57-58页
        4.2.3 LSTM与VLAD对比实验第58-59页
        4.2.4 TRECVID2015 MED竞赛结果第59页
    4.3 netVLAD第59-65页
        4.3.1 netVLAD公式推导第60-61页
        4.3.2 参数学习第61-62页
        4.3.3 基于netVLAD的多媒体事件的时空表示第62页
        4.3.4 归一化层对比实验第62-63页
        4.3.5 损失函数对比实验第63-64页
        4.3.6 netVLAD与VLAD对比实验第64-65页
    4.4 时域卷积第65-69页
        4.4.1 原理介绍第65-66页
        4.4.2 基于时域卷积的多媒体事件的时空表示第66-67页
        4.4.3 时域卷积与其他方法对比实验第67-69页
第五章 基于Linear SVM的多媒体事件分类第69-80页
    5.1 支持向量机第69-70页
        5.1.1 支持向量机求解第69页
        5.1.2 基于Linear SVM的多媒体事件置信度计算第69-70页
    5.2 模型融合第70-72页
        5.2.1 多模型融合方法第71页
        5.2.2 多模型融合对比实验第71-72页
    5.3 多媒体事件检测实现第72-74页
        5.3.1 多媒体事件检测流程第72-74页
        5.3.2 线程调用第74页
    5.4 实验结果及分析第74-80页
        5.4.1 与其他方法的对比实验第75-76页
        5.4.2 TRECVID2016 MED竞赛第76-77页
        5.4.3 全国网络舆情(音视频)分析技术邀请赛特定视频识别第77-80页
第六章 总结与展望第80-82页
    6.1 总结第80页
    6.2 创新点第80-81页
    6.3 展望第81-82页
参考文献第82-85页
致谢第85-86页
攻读学位期间发表的学术论文目录第86页

论文共86页,点击 下载论文
上一篇:基于深度学习的人脸检测与识别
下一篇:基于大数据的用户特征及活跃度分析