跨媒体数据的语义分类和检索
致谢 | 第1-7页 |
中文摘要 | 第7-8页 |
ABSTRACT | 第8-13页 |
主要符号对照表 | 第13-14页 |
1 绪论 | 第14-24页 |
·选题背景和意义 | 第15-16页 |
·跨媒体的基本概念与挑战 | 第16-17页 |
·本文的研究问题 | 第17-20页 |
·本文的研究内容及贡献 | 第20-21页 |
·论文组织结构 | 第21-24页 |
2 跨媒体分析的研究进展 | 第24-36页 |
·跨媒体数据的统一表示 | 第24-28页 |
·典型相关性分析模型 | 第24-25页 |
·核典型相关性分析模型 | 第25页 |
·深度典型相关性分析模型 | 第25-27页 |
·三视角典型相关性分析模型 | 第27-28页 |
·跨媒体数据的索引 | 第28-32页 |
·基于CCA的哈希模型 | 第28-29页 |
·基于潜在语义分析的哈希模型 | 第29-31页 |
·基于神经网络的哈希模型 | 第31-32页 |
·跨媒体数据的属性学习 | 第32-34页 |
·其它相关工作 | 第34页 |
·小结 | 第34-36页 |
3 基于跨媒体语义增强的图像检索 | 第36-48页 |
·引言 | 第36-37页 |
·跨媒体语义增强框架 | 第37-39页 |
·跨媒体语义增强中的同构空间学习 | 第39-42页 |
·基于文本的线性判别分析 | 第39-40页 |
·图像和文本的典型相关性分析 | 第40页 |
·同构空间特征学习方法 | 第40-42页 |
·实验结果与分析 | 第42-45页 |
·实验设置 | 第42页 |
·性能评估 | 第42-45页 |
·小结 | 第45-48页 |
4 任务驱动的跨媒体检索 | 第48-60页 |
·引言 | 第48-50页 |
·任务驱动的同构空间学习 | 第50-52页 |
·I2T算法 | 第51页 |
·T2I算法 | 第51页 |
·优化求解 | 第51-52页 |
·实验结果和分析 | 第52-58页 |
·实验设置 | 第54-55页 |
·实验结果和分析 | 第55-58页 |
·小结 | 第58-60页 |
5 基于深度视觉特征的跨媒体检索 | 第60-84页 |
·引言 | 第60-62页 |
·图像语义分析的背景 | 第62-68页 |
·基于人工设计特征的语义分析模型 | 第62-63页 |
·基于学习特征的语义分析模型 | 第63-68页 |
·CNN视觉特征抽取和深度语义匹配算法 | 第68-72页 |
·抽取基于预训练CNN模型的视觉特征 | 第69页 |
·抽取基于微调CNN模型的视觉特征 | 第69-71页 |
·深度语义匹配算法 | 第71-72页 |
·实验结果与分析 | 第72-82页 |
·数据集及实验设置 | 第72-74页 |
·Wikipedia的实验结果和分析 | 第74-76页 |
·Pascal Sentence的实验结果和分析 | 第76-79页 |
·INRIA-Websearch的实验结果和分析 | 第79-80页 |
·Pascal VOC 2007的实验结果和分析 | 第80-81页 |
·NUS-WIDE的实验结果和分析 | 第81-82页 |
·小结 | 第82-84页 |
6 基于CNN的图像多标签属性分类 | 第84-108页 |
·引言 | 第84-87页 |
·HCP方法 | 第87-93页 |
·Hypotheses抽取 | 第89-90页 |
·HCP训练 | 第90-93页 |
·实验结果与分析 | 第93-107页 |
·数据集与实验设置 | 第93-95页 |
·验证实验 | 第95-99页 |
·图像分类结果 | 第99-107页 |
·小结 | 第107-108页 |
7 总结与展望 | 第108-110页 |
·工作总结 | 第108-109页 |
·未来工作展望 | 第109-110页 |
参考文献 | 第110-118页 |
作者简历 | 第118-120页 |
攻读博士学位期间发表的学术论文 | 第120-124页 |
学位论文数据集 | 第124页 |