视觉语言分析：从底层视觉特征表达到语义距离学习

摘要	第1-7页
ABSTRACT	第7-10页
目录	第10-17页
第1章绪论	第17-31页
·图像分析和标注的发展简述	第17-24页
·图像分析和标注的关键问题	第24-27页
·语义鸿沟问题(Semantic Gap)	第24页
·大尺度问题(Large Scale)	第24-25页
·文本和视觉差异(Gap Between Text and Image)	第25-26页
·概念表达问题(Semantic Representation)	第26-27页
·相似性度量问题(Similarity Measurement)	第27页
·研究目的和任务	第27-28页
·主要内容和结构安排	第28-31页
第2章低层视觉分析	第31-47页
·视觉特征	第31-34页
·灰度平均值	第32页
·图像矩	第32页
·纹理直方图	第32-33页
·旋转不变纹理直方图	第33-34页
·尺度不变特征变换(SIFT)	第34页
·从视觉特征到视觉单词	第34-42页
·利用主成分分析进行映射	第35-36页
·通过聚类映射	第36-38页
·哈希编码映射	第38-39页
·通过距离学习的方法映射	第39-42页
·通过多种途径映射	第42页
·图像表达	第42-44页
·小结	第44-47页
第3章图像距离度量	第47-71页
·图像距离	第47-48页
·静态距离度量	第48-50页
·动态距离度量(QOSS)	第50-52页
·Mahalanobis距离	第52-54页
·传统Mahanalobis距离学习	第54-56页
·相关成分分析(RCA)	第55页
·区分成分分析(DCA)	第55页
·邻近成分分析(NCA)	第55-56页
·最大边际近邻分类(LMNN)	第56页
·概率相关成分分析(pRCA)	第56-63页
·确定边信息和非确定边信息	第56-57页
·非确定边信息生成	第57-58页
·计算	第58-59页
·基于非确定边信息的图像距离学习	第59-60页
·算法	第60-63页
·概率区分成分分析(pDCA)	第63页
·Bregman距离学习(Bregman Distance)	第63-69页
·Bregman距离函数	第65-66页
·Bregman距离学习	第66-67页
·算法	第67-69页
·小结	第69-71页
第4章高层语义分析	第71-97页
·"概念"定义	第71-72页
·单词包模型(BoW)	第72-74页
·Naive Bayes分类框架	第72页
·分层Bayes分类框架	第72-74页
·基于单词包模型的图像表达	第74页
·维隐马尔科夫模型(2D HMM)	第74-76页
·视觉语言模型(VLM)	第76-81页
·一元视觉语言模型	第78-79页
·二元视觉语言模型	第79-80页
·三元视觉语言模型	第80-81页
·尺度不变视觉语言模型(m-VLM)	第81-84页
·尺度问题	第81-84页
·保语义单词包模型(SPBoW)	第84-93页
·模型的原理	第84-85页
·视觉物体表达	第85-86页
·基于学习的词典优化	第86-90页
·词典生成过程	第90-92页
·视觉单词直方图	第92-93页
·保语义单词包模型在生成式和区分式模型中的应用	第93-95页
·生成式模型	第94-95页
·区分式模型	第95页
·小结	第95-97页
第5章视觉概念距离度量	第97-113页
·视觉概念距离研究概况	第97-100页
·词网距离(WordNet Distance)	第100页
·谷歌距离(Google Distance)	第100-101页
·标签共发距离(Tag Concurrence Distance)	第101-102页
·Flickr距离(FD)(Flickr Distance)	第102-106页
·Flickr距离概述	第103-105页
·概念距离度量	第105-106页
·视觉概念网络	第106-107页
·各种概念距离度量方法的测评	第107-111页
·主观测评	第108-111页
·客观测评	第111页
·小结	第111-113页
第6章应用	第113-143页
·近似图像检测(Near-Duplicate Detection)	第113-118页
·方法概述	第114-115页
·离线索引	第115页
·在线检测	第115页
·实验设置	第115-116页
·客观评测	第116页
·结果比较	第116-118页
·基于搜索的图像标注(Search Based Image Annotation)	第118-124页
·相关研究背景介绍	第119页
·自动图像标注	第119-121页
·结果比较	第121-124页
·基于内容的图像分类(Content Based Image Classification)	第124-132页
·利用视觉语言模型进行图像分类	第126-128页
·合理利用未现单词进行图像分类	第128-129页
·图像分类实验	第129-132页
·视觉概念聚类(Visual Concept Clustering)	第132-133页
·社会网络图像标注推荐(Social Media Recommendation)	第133-140页
·实验过程	第137页
·评价	第137页
·比较标签共发和多模态相关算法	第137-139页
·比较Rankboost和线性叠加算法	第139-140页
·小结	第140-143页
第7章总结和展望	第143-145页
·视觉语言分析及距离度量的本质	第143-144页
·本文的学术价值	第144页
·视觉分析与度量的未来发展	第144-145页
参考文献	第145-155页
致谢	第155-157页
在读期间发表的学术论文与取得的研究成果	第157-159页