首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于视觉注意的视觉问答方法研究

中文摘要第4-6页
abstract第6-8页
第一章 绪论第11-24页
    1.1 课题研究背景与意义第11-12页
    1.2 研究现状第12-20页
        1.2.1 传统视觉问答方法第13-14页
        1.2.2 基于注意力机制的视觉问答方法第14-19页
        1.2.3 其他视觉问答方法第19-20页
    1.3 目前存在的主要问题第20-21页
    1.4 本文主要工作及创新点第21-22页
    1.5 本文结构安排第22-24页
第二章 基于空间信息增强的视觉注意网络的视觉问答方法第24-39页
    2.1 方法整体框架描述第24页
    2.2 深度特征抽取模型第24-29页
        2.2.1 图像特征抽取第25-27页
        2.2.2 问题语义特征抽取第27-29页
    2.3 基于视觉注意机制的显著特征提取第29-31页
        2.3.1 视觉注意力机制计算模型第29-30页
        2.3.2 视觉显著特征提取描述第30-31页
    2.4 空间信息增强的注意力网络框架描述第31-32页
    2.5 实验结果分析第32-38页
        2.5.1 VQA数据集和COCO-QA数据集介绍第32-33页
        2.5.2 模型实现细节第33-34页
        2.5.3 注意力层数对性能的影响第34-35页
        2.5.4 方法性能比较分析第35-37页
        2.5.5 注意力层可视化第37-38页
    2.6 本章小结第38-39页
第三章 基于多模态交叉引导协同注意网络的视觉问答方法第39-53页
    3.1 方法整体框架描述第39-40页
    3.2 基于候选区域的图像特征抽取第40-42页
        3.2.1 目标检测概述第40-42页
        3.2.2 候选区域特征抽取第42页
    3.3 基于非线性激活的注意力机制第42-45页
        3.3.1 MCAN的激活方法第42-44页
        3.3.2 非线性激活注意力机制第44-45页
    3.4 多模态交叉引导协同注意网络第45-47页
        3.4.1 模型的输入第45-46页
        3.4.2 多层交叉引导协同注意第46-47页
        3.4.3 预测答案第47页
    3.5 实验结果分析第47-51页
        3.5.1 模型实现细节第47-48页
        3.5.2 结果和分析第48-50页
        3.5.3 消融学习第50-51页
        3.5.4 定量分析第51页
    3.6 本章小结第51-53页
第四章 基于视觉语义概念的增强协同注意网络的视觉问答方法第53-65页
    4.1 方法整体框架描述第53页
    4.2 视觉语义概念提取第53-54页
    4.3 分层的问题语义抽取第54-58页
        4.3.1 问题中单词的表示方法第54-57页
        4.3.2 基于卷积神经网络的句子语义抽取模型第57-58页
        4.3.3 分层语义抽取第58页
    4.4 增强的协同注意网络第58-60页
        4.4.1 序列化协同注意网络第58-60页
        4.4.2 答案预测第60页
    4.5 实验结果分析第60-64页
        4.5.1 结果和分析第60-63页
        4.5.2 注意力可视化第63-64页
    4.6 本章小结第64-65页
第五章 总结与展望第65-67页
    5.1 论文工作总结第65-66页
    5.2 未来工作展望第66-67页
参考文献第67-75页
攻读学位期间参与科研项目和公开发表的论文第75-77页
致谢第77-78页

论文共78页,点击 下载论文
上一篇:基于强区分性区域的细粒度图像分类研究
下一篇:基于用户偏好的服装个性化推荐