首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

视觉问答中的多模态信息融合

摘要第4-5页
Abstract第5-6页
第1章 绪论第11-23页
    1.1 研究背景第11-14页
    1.2 国内外研究现状第14-21页
        1.2.1 Attention结构的研究第15-17页
        1.2.2 特征融合的研究第17-19页
        1.2.3 基于外部知识的模型研究第19-21页
        1.2.4 对模型架构的研究第21页
    1.3 论文研究的主要内容与贡献第21-23页
第2章 视觉问答介绍第23-39页
    2.1 任务描述第23-24页
    2.2 数据集第24-28页
    2.3 基础架构第28-37页
        2.3.1 图像编码第28-30页
        2.3.2 问题编码第30-34页
        2.3.3 Attention机制第34-35页
        2.3.4 特征融合第35-37页
        2.3.5 答案预测第37页
    2.4 评估方法第37-38页
    2.5 本章小结第38-39页
第3章 视觉问答模型的单模态特征融合第39-49页
    3.1 动机与方法第39-40页
    3.2 生成图像描述第40-42页
    3.3 单模态视觉问答模型第42-43页
    3.4 实验及结果第43-47页
        3.4.1 模型训练第44页
        3.4.2 实验设计与结果分析第44-47页
    3.5 本章小结第47-49页
第4章 视觉问答模型中的特征增强第49-67页
    4.1 动机与方法第49-50页
    4.2 为图像区域增补文本特征第50-53页
    4.3 特征增强与Attention机制第53-62页
        4.3.1 模型设计第53-56页
        4.3.2 实验配置第56-57页
        4.3.3 特征增强模型间的比较第57-59页
        4.3.4 不同问题类型下的模型差异第59-60页
        4.3.5 不同特征增强方案下的Attention权重可视化第60-62页
    4.4 附带特征增强的视觉问答模型第62-65页
        4.4.1 模型设计与训练第62-63页
        4.4.2 与现有模型的比较第63-65页
    4.5 本章小结第65-67页
第5章 总结与展望第67-69页
    5.1 工作总结第67-68页
    5.2 讨论与展望第68-69页
参考文献第69-75页
攻读硕士学位期间主要的研究成果第75-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:基于多传感器的物联网监测系统设计与实现
下一篇:翻转课堂教学模式对高中生英语写作的效用研究