首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--多媒体技术与多媒体计算机论文

基于语义先验约束的多媒体特征表示研究

摘要第3-5页
Abstract第5-7页
第一章 绪论第11-21页
    1.1 研究背景和研究意义第11-14页
    1.2 研究内容第14-17页
    1.3 论文的组织结构第17-21页
第二章 研究现状概述第21-31页
    2.1 基于传统方法的特征表示第21-23页
        2.1.1 文本的传统特征表示方法第21-22页
        2.1.2 图片的传统特征表示方法第22-23页
        2.1.3 视频的传统特征表示方法第23页
    2.2 基于深度学习的特征表示第23-24页
        2.2.1 文本的深度特征表示方法第23-24页
        2.2.2 图片的深度特征表示方法第24页
        2.2.3 视频的深度特征表示方法第24页
    2.3 坐标预测任务相关工作简述第24-26页
        2.3.1 脸部关键点检测第24-25页
        2.3.2 非刚性运动结构恢复第25-26页
    2.4 视频文字描述任务相关工作简述第26-27页
        2.4.1 基于模板匹配的方法第26页
        2.4.2 基于编码-解码的方法第26-27页
    2.5 多模态知识表示任务相关工作简述第27-31页
        2.5.1 文本知识表示学习第27-28页
        2.5.2 视觉知识表示学习第28-29页
        2.5.3 多模态学习第29-31页
第三章 2D/3D坐标预测任务中基于几何信息先验的图像深度特征表示研究第31-53页
    3.1 引言第31-33页
    3.2 方法介绍第33-41页
        3.2.1 几何信息先验特征表示技术第33-36页
        3.2.2 在2D/3D坐标预测任务中的应用第36-41页
    3.3 实验结果和分析第41-52页
        3.3.1 脸部关键点检测第41-50页
        3.3.2 非刚性运动结构恢复第50-52页
    3.4 本章小结第52-53页
第四章 视频文字描述任务中基于属性先验的视频深度特征表示研究第53-75页
    4.1 引言第53-56页
    4.2 方法介绍第56-62页
        4.2.1 视频中层特征表示方法第56-58页
        4.2.2 视频属性词典构建第58页
        4.2.3 视频深度属性特征表示学习第58-59页
        4.2.4 序列到序列的视频文字描述生成第59-62页
    4.3 实验结果和分析第62-73页
        4.3.1 数据集分析第63页
        4.3.2 实验阅评估标准第63-64页
        4.3.3 视频文字描述生成的实验结果与分析第64-70页
        4.3.4 视频动作分类的实验结果与分析第70-73页
    4.4 本章小结第73-75页
第五章 多模态知识表示任务中基于跨模态知识关联的多模态深度特征表示研究第75-93页
    5.1 引言第75-78页
    5.2 方法介绍第78-85页
        5.2.1 问题定义第78页
        5.2.2 网络监督的多模态关系挖掘第78-81页
        5.2.3 双向增强的跨模态知识表示第81-85页
    5.3 数据集构建与实现细节第85-86页
    5.4 实验结果与分析第86-92页
        5.4.1 零样本多模态检索第86-90页
        5.4.2 视觉关系识别第90-92页
    5.5 本章小结第92-93页
第六章 总结与展望第93-97页
    6.1 工作总结第93-94页
    6.2 研究展望第94-97页
参考文献第97-113页
攻读博士期间的科研成果第113-115页
简历第115-117页
致谢第117-118页

论文共118页,点击 下载论文
上一篇:基于深度学习的图像情感分析研究
下一篇:数字图像复制—粘贴篡改被动取证技术研究