基于结构化文本的图像语义描述生成方法研究
摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第一章 绪论 | 第8-14页 |
1.1 课题的研究背景和意义 | 第8-9页 |
1.2 国内外研究现状 | 第9-11页 |
1.2.1 主要研究方法 | 第10-11页 |
1.3 本文研究内容 | 第11-12页 |
1.4 论文术语及缩略语 | 第12页 |
1.5 论文组织结构 | 第12-14页 |
第二章 相关技术介绍 | 第14-22页 |
2.1 图像信息多样性的表示方法 | 第14-15页 |
2.2 基于识别的方法 | 第15页 |
2.3 同维度投影方法 | 第15-16页 |
2.4 CNN-RNN深度学习模型方法 | 第16-17页 |
2.5 方法间的差别和本方法的贡献 | 第17-18页 |
2.5.1 不同的结构概念形式 | 第17页 |
2.5.2 不同的概念预测方法 | 第17-18页 |
2.5.3 本文贡献 | 第18页 |
2.6 本章小结 | 第18-22页 |
第三章 基于多任务学习的结构化文本生成方法 | 第22-30页 |
3.1 研究背景 | 第22-23页 |
3.2 算法流程 | 第23-29页 |
3.2.1 图像特征提取 | 第24-26页 |
3.2.2 结构化文本提取 | 第26-27页 |
3.2.3 多任务学习的方式进行模型训练 | 第27-29页 |
3.3 本章小结 | 第29-30页 |
第四章 基于结构化文本的图像描述生成方法 | 第30-36页 |
4.1 研究背景 | 第30-31页 |
4.2 算法设计 | 第31-34页 |
4.2.1 目标函数设计 | 第32页 |
4.2.2 LSTM结构单元 | 第32-34页 |
4.2.3 算法伪代码 | 第34页 |
4.3 本章小结 | 第34-36页 |
第五章 实验 | 第36-50页 |
5.1 结构化文本生成实验分析 | 第36-38页 |
5.1.1 数据集 | 第36页 |
5.1.2 评价指标 | 第36-37页 |
5.1.3 对比算法 | 第37页 |
5.1.4 实验结果分析 | 第37-38页 |
5.2 图像描述生成实验分析 | 第38-45页 |
5.2.1 数据集 | 第40页 |
5.2.2 评价指标 | 第40页 |
5.2.3 对比算法 | 第40-41页 |
5.2.4 实验结果分析 | 第41-45页 |
5.2.5 模型参数分析 | 第45页 |
5.3 SVO与结构化文本性能对比实验分析 | 第45-48页 |
5.4 本章小结 | 第48-50页 |
第六章 总结与展望 | 第50-52页 |
6.1 总结 | 第50页 |
6.2 展望 | 第50-52页 |
参考文献 | 第52-56页 |
发表论文和参加科研情况说明 | 第56-58页 |
致谢 | 第58-59页 |