中文摘要 | 第5-6页 |
ABSTRACT | 第6页 |
1.绪论 | 第9-22页 |
1.1 VQA | 第9-12页 |
1.2 课题背景 | 第12-14页 |
1.3 国内外研究现状 | 第14-20页 |
1.3.1 CNN-LSTM模型 | 第14-16页 |
1.3.2 Attention-CNN-LSTM模型 | 第16-17页 |
1.3.3 动态记忆网络架构 | 第17-18页 |
1.3.4 动态参数预测网络 | 第18-19页 |
1.3.5 基于外部知识库及属性算法 | 第19-20页 |
1.4 本文的主要研究内容 | 第20-22页 |
2.DMN与DPPnet研究 | 第22-33页 |
2.1 DMN研究 | 第22-29页 |
2.1.1 DMN模型 | 第22-24页 |
2.1.2 改进的动态记忆网络:DMN+模型 | 第24-29页 |
2.2 DPPnet研究 | 第29-31页 |
2.2.1 问题制定 | 第29页 |
2.2.2 网络架构 | 第29-31页 |
2.3 改进的DPPnet(Spatial-DCTHashDPPnet)研究 | 第31-33页 |
2.3.1 空间离散余弦Hash(Spatial-DCTHash)卷积层构建 | 第32-33页 |
3.高层语义概念与外部知识库研究 | 第33-37页 |
3.1 高层语义概念研究 | 第33-34页 |
3.2 外部知识库研究 | 第34-37页 |
3.2.1 基于外部知识库VQA框架简介 | 第35-36页 |
3.2.2 提取、编码与合并 | 第36-37页 |
4.基于动态参数记忆网络和高层概念的视觉问答实现 | 第37-45页 |
4.1 问题语义处理方面 | 第38-39页 |
4.2 图像卷积神经网络构建 | 第39-41页 |
4.3 Hash(Spatial-DCTHash)卷积层构建 | 第41-42页 |
4.4 双向双重GRU模型构建 | 第42-43页 |
4.5 高级概念融合 | 第43-45页 |
5.实验设置与评估分析 | 第45-50页 |
5.1 数据集与实验设置 | 第45-46页 |
5.2 实验结果与评估分析 | 第46-49页 |
5.3 预测结果样例展示 | 第49-50页 |
6.总结与展望 | 第50-52页 |
参考文献 | 第52-56页 |
攻读硕士学位期间发表学术论文情况 | 第56-57页 |
致谢 | 第57-58页 |
作者简介 | 第58-60页 |