基于深度学习的图像特征理解与语义表达

摘要	第5-7页
ABSTRACT	第7-8页
第1章绪论	第15-27页
1.1 研究背景与意义	第15-17页
1.2 图像语义理解的关键问题	第17-19页
1.3 本文的研究内容与主要工作	第19-22页
1.4 本文主要创新点	第22-24页
1.5 本文组织结构	第24-27页
第2章国内外研究现状	第27-37页
2.1 视觉关系识别	第27-30页
2.1.1 上下文学习	第27-28页
2.1.2 类层次结构	第28-29页
2.1.3 视觉关系识别	第29-30页
2.2 密集型图像描述生成	第30-31页
2.2.1 图像描述生成	第30-31页
2.2.2 密集型图像描述	第31页
2.3 文本生成高清图像	第31-35页
2.3.1 生成对抗网络	第32-33页
2.3.2 基于文本生成高清图像的条件生成对抗网络	第33-34页
2.3.3 条件批量归一化	第34-35页
2.4 已有算法存在的不足	第35-37页
第3章视觉关系识别	第37-59页
3.1 引言	第37-40页
3.2 “空间-上下文-外观”的信息交互	第40-44页
3.2.1 外观,上下文以及空间位置	第40-41页
3.2.2 “空间-上下文-外观”模块	第41-42页
3.2.3 变焦网络:层叠的空间-上下文-信息模块	第42-44页
3.3 类内多层语义标签树	第44-48页
3.3.1 针对主语(宾语)的语义标签树	第47页
3.3.2 针对谓语的语义标签树	第47-48页
3.3.3 多级语义标签损失函数	第48页
3.4 实验	第48-57页
3.4.1 实验设置	第48-49页
3.4.2 实验结果与分析	第49-50页
3.4.3 消融实验	第50-53页
3.4.4 视觉关系检测	第53-55页
3.4.5 拓展性分析	第55-57页
3.5 本章小结	第57-59页
第4章密集型图像描述生成	第59-79页
4.1 引言	第59-62页
4.2 基于上下文信息以及语言属性的网络结构	第62页
4.3 基于非局部均值的个体信息融合	第62-65页
4.3.1 非局部均值算法	第63页
4.3.2 基于非局部均值的特征提取	第63-65页
4.4 基于语言属性损失函数的上下文信息融合	第65-68页
4.4.1 多尺度上下文信息融合	第65-66页
4.4.2 层叠性语义监督的标签生成	第66-68页
4.5 实验	第68-77页
4.5.1 实验设置	第68-71页
4.5.2 实验结果与分析	第71-72页
4.5.3 消融实验	第72-77页
4.6 本章小结	第77-79页
第5章文本生成高清图像	第79-101页
5.1 引言	第79-82页
5.2 语义解析生成对抗网络	第82页
5.3 基于Siamese结构的多层级生成对抗网络	第82-87页
5.3.1 文本编码器	第83页
5.3.2 多层级生成对抗网络	第83-84页
5.3.3 对比度损失函数	第84-85页
5.3.4 结合对比度损失函数的判别器	第85-87页
5.4 基于语义的条件批量归一化	第87-89页
5.4.1 批量归一化	第87页
5.4.2 条件批量归一化	第87-88页
5.4.3 语义条件批量归一化	第88-89页
5.5 实验	第89-100页
5.5.1 实验设置	第89-92页
5.5.2 实验结果与分析	第92-93页
5.5.3 消融实验	第93-97页
5.5.4 泛化能力分析	第97-98页
5.5.5 参数分析	第98-100页
5.6 本章小结	第100-101页
第6章总结与展望	第101-105页
6.1 论文总结	第101-103页
6.2 研究展望	第103-105页
参考文献	第105-117页
致谢	第117-119页
在读期间发表的学术论文与取得的研究成果	第119-120页