首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

视觉语言分析:从底层视觉特征表达到语义距离学习

摘要第1-7页
ABSTRACT第7-10页
目录第10-17页
第1章 绪论第17-31页
   ·图像分析和标注的发展简述第17-24页
   ·图像分析和标注的关键问题第24-27页
     ·语义鸿沟问题(Semantic Gap)第24页
     ·大尺度问题(Large Scale)第24-25页
     ·文本和视觉差异(Gap Between Text and Image)第25-26页
     ·概念表达问题(Semantic Representation)第26-27页
     ·相似性度量问题(Similarity Measurement)第27页
   ·研究目的和任务第27-28页
   ·主要内容和结构安排第28-31页
第2章 低层视觉分析第31-47页
   ·视觉特征第31-34页
     ·灰度平均值第32页
     ·图像矩第32页
     ·纹理直方图第32-33页
     ·旋转不变纹理直方图第33-34页
     ·尺度不变特征变换(SIFT)第34页
   ·从视觉特征到视觉单词第34-42页
     ·利用主成分分析进行映射第35-36页
     ·通过聚类映射第36-38页
     ·哈希编码映射第38-39页
     ·通过距离学习的方法映射第39-42页
     ·通过多种途径映射第42页
   ·图像表达第42-44页
   ·小结第44-47页
第3章 图像距离度量第47-71页
   ·图像距离第47-48页
   ·静态距离度量第48-50页
   ·动态距离度量(QOSS)第50-52页
   ·Mahalanobis距离第52-54页
   ·传统Mahanalobis距离学习第54-56页
     ·相关成分分析(RCA)第55页
     ·区分成分分析(DCA)第55页
     ·邻近成分分析(NCA)第55-56页
     ·最大边际近邻分类(LMNN)第56页
   ·概率相关成分分析(pRCA)第56-63页
     ·确定边信息和非确定边信息第56-57页
     ·非确定边信息生成第57-58页
     ·计算第58-59页
     ·基于非确定边信息的图像距离学习第59-60页
     ·算法第60-63页
   ·概率区分成分分析(pDCA)第63页
   ·Bregman距离学习(Bregman Distance)第63-69页
     ·Bregman距离函数第65-66页
     ·Bregman距离学习第66-67页
     ·算法第67-69页
   ·小结第69-71页
第4章 高层语义分析第71-97页
   ·"概念"定义第71-72页
   ·单词包模型(BoW)第72-74页
     ·Naive Bayes分类框架第72页
     ·分层Bayes分类框架第72-74页
     ·基于单词包模型的图像表达第74页
   ·维隐马尔科夫模型(2D HMM)第74-76页
   ·视觉语言模型(VLM)第76-81页
     ·一元视觉语言模型第78-79页
     ·二元视觉语言模型第79-80页
     ·三元视觉语言模型第80-81页
   ·尺度不变视觉语言模型(m-VLM)第81-84页
     ·尺度问题第81-84页
   ·保语义单词包模型(SPBoW)第84-93页
     ·模型的原理第84-85页
     ·视觉物体表达第85-86页
     ·基于学习的词典优化第86-90页
     ·词典生成过程第90-92页
     ·视觉单词直方图第92-93页
   ·保语义单词包模型在生成式和区分式模型中的应用第93-95页
     ·生成式模型第94-95页
     ·区分式模型第95页
   ·小结第95-97页
第5章 视觉概念距离度量第97-113页
   ·视觉概念距离研究概况第97-100页
   ·词网距离(WordNet Distance)第100页
   ·谷歌距离(Google Distance)第100-101页
   ·标签共发距离(Tag Concurrence Distance)第101-102页
   ·Flickr距离(FD)(Flickr Distance)第102-106页
     ·Flickr距离概述第103-105页
     ·概念距离度量第105-106页
   ·视觉概念网络第106-107页
   ·各种概念距离度量方法的测评第107-111页
     ·主观测评第108-111页
     ·客观测评第111页
   ·小结第111-113页
第6章 应用第113-143页
   ·近似图像检测(Near-Duplicate Detection)第113-118页
     ·方法概述第114-115页
     ·离线索引第115页
     ·在线检测第115页
     ·实验设置第115-116页
     ·客观评测第116页
     ·结果比较第116-118页
   ·基于搜索的图像标注(Search Based Image Annotation)第118-124页
     ·相关研究背景介绍第119页
     ·自动图像标注第119-121页
     ·结果比较第121-124页
   ·基于内容的图像分类(Content Based Image Classification)第124-132页
     ·利用视觉语言模型进行图像分类第126-128页
     ·合理利用未现单词进行图像分类第128-129页
     ·图像分类实验第129-132页
   ·视觉概念聚类(Visual Concept Clustering)第132-133页
   ·社会网络图像标注推荐(Social Media Recommendation)第133-140页
     ·实验过程第137页
     ·评价第137页
     ·比较标签共发和多模态相关算法第137-139页
     ·比较Rankboost和线性叠加算法第139-140页
   ·小结第140-143页
第7章 总结和展望第143-145页
   ·视觉语言分析及距离度量的本质第143-144页
   ·本文的学术价值第144页
   ·视觉分析与度量的未来发展第144-145页
参考文献第145-155页
致谢第155-157页
在读期间发表的学术论文与取得的研究成果第157-159页

论文共159页,点击 下载论文
上一篇:海量网络视频快速检索关键技术研究
下一篇:基于选择嵌入域的图像隐写研究