首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于注意力机制与高层语义的视觉问答研究

摘要第5-7页
ABSTRACT第7-9页
第1章 绪论第19-30页
    1.1 研究背景第19-24页
    1.2 国内外研究现状第24-28页
        1.2.1 基于多模态融合的方法第24-26页
        1.2.2 基于高层语义的方法第26页
        1.2.3 注意力机制第26-27页
        1.2.4 复合模型第27-28页
    1.3 本文研究内容与结构安排第28-30页
第2章 基于多层次注意力网络的视觉问答第30-44页
    2.1 背景介绍第30-32页
    2.2 相关工作第32-33页
    2.3 多层次注意力网络第33-38页
        2.3.1 语义注意力第33-35页
        2.3.2 上下文已知的视觉注意力第35-37页
        2.3.3 联合学习第37-38页
    2.4 实验评估第38-43页
        2.4.1 数据集第38-39页
        2.4.2 评估标准第39页
        2.4.3 实验设置第39-41页
        2.4.4 消融模型第41页
        2.4.5 实验结果与分析第41-43页
        2.4.6 注意力可视化第43页
    2.5 总结与讨论第43-44页
第3章 基于多源多层次注意力网络的视觉问答第44-62页
    3.1 背景介绍第44-47页
    3.2 相关工作第47-49页
    3.3 多源多层次注意力网络第49-54页
        3.3.1 上下文已知的视觉注意力第49-52页
        3.3.2 属性注意力第52页
        3.3.3 知识注意力第52-53页
        3.3.4 联合学习第53-54页
    3.4 实验评估第54-60页
        3.4.1 数据集第54页
        3.4.2 评价标准第54-55页
        3.4.3 实验设置第55-56页
        3.4.4 消融模型第56-57页
        3.4.5 实验结果与分析第57-60页
        3.4.6 注意力可视化第60页
    3.5 讨论与总结第60-62页
第4章 基于图注意力网络的视觉问答第62-75页
    4.1 背景介绍第62-64页
    4.2 相关工作第64-65页
    4.3 图注意力网络第65-68页
        4.3.1 节点选择第65-67页
        4.3.2 图构建第67-68页
        4.3.3 图嵌入第68页
    4.4 实验第68-74页
        4.4.1 数据集第68-69页
        4.4.2 评估标准第69页
        4.4.3 实验设置第69-70页
        4.4.4 消融实验研究第70-71页
        4.4.5 结果与分析第71-74页
    4.5 总结与讨论第74-75页
第5章 基于属性和字幕的可解释视觉问答第75-87页
    5.1 背景介绍第75-77页
    5.2 相关工作第77页
    5.3 方法部分第77-80页
        5.3.1 单词预测第77-79页
        5.3.2 句子生成第79页
        5.3.3 答案推理第79-80页
    5.4 实验与分析第80-86页
        5.4.1 实验设置第80页
        5.4.2 基于单词的视觉问答第80-81页
        5.4.3 基于句子的视觉问答第81-83页
        5.4.4 案例分析第83-85页
        5.4.5 性能比较第85-86页
    5.5 总结与讨论第86-87页
第6章 总结与展望第87-90页
    6.1 全文总结第87-88页
    6.2 未来工作与展望第88-90页
参考文献第90-96页
致谢第96-97页
在读期间发表的学术论文与取得的研究成果第97页

论文共97页,点击 下载论文
上一篇:真诚型领导和程序性公平对组织公民行为的联合效应
下一篇:复杂场景下基于深度学习的鲁棒性语音识别的研究