多模态特征融合和变量选择的视频语义理解
摘要 | 第1-7页 |
Abstract | 第7-15页 |
第1章 绪论 | 第15-23页 |
·研究背景 | 第15-16页 |
·研究问题 | 第16-20页 |
·本文研究目标与贡献 | 第20-22页 |
·本文组织结构 | 第22-23页 |
第2章 视频语义分析与理解相关研究综述 | 第23-38页 |
·多媒体底层特征提取 | 第23-30页 |
·图像特征 | 第24-28页 |
·音频特征 | 第28-29页 |
·文本特征 | 第29-30页 |
·基于内容的图像检索 | 第30-32页 |
·基于语义内容的视频检索 | 第32-38页 |
·视频内容结构化 | 第32-35页 |
·视频的多模态特性及融合分析 | 第35-36页 |
·机器学习与视频语义分析理解 | 第36-38页 |
第3章 基于多模态子空间相关性传递的视频语义挖掘 | 第38-50页 |
·引言 | 第38-41页 |
·基于多模态子空间相关性传递的视频语义挖掘 | 第41-46页 |
·底层特征提取 | 第41-42页 |
·多模态子空间相关性传递 | 第42-44页 |
·LPP降维 | 第44-45页 |
·训练分类器 | 第45页 |
·语义概念检测 | 第45-46页 |
·实验与讨论 | 第46-49页 |
·融合方法的比较 | 第47页 |
·异构数据相似度方法的比较 | 第47-48页 |
·降维方法的比较 | 第48-49页 |
·本章小结 | 第49-50页 |
第4章 基于张量表示的多模态视频语义概念检测 | 第50-85页 |
·引言 | 第50-53页 |
·张量基础知识 | 第53-56页 |
·张量几何 | 第53-55页 |
·监督张量学习框架 | 第55-56页 |
·基于张量的视频镜头表达 | 第56-57页 |
·底层特征提取 | 第56页 |
·张量镜头的定义和表达 | 第56-57页 |
·张量镜头的语义子空间嵌入与降维 | 第57-64页 |
·张量镜头间的语义传递 | 第57-58页 |
·最优张量镜头子空间嵌入 | 第58-61页 |
·几何证明 | 第61-62页 |
·张量镜头子空间嵌入和降维算法 | 第62-64页 |
·基于张量镜头的视频语义概念检测 | 第64-74页 |
·基于支持张量机的基本张量镜头语义概念检测 | 第64-65页 |
·基于主动学习的后精化处理 | 第65-69页 |
·基于直推式学习的张量镜头语义概念检测 | 第69-74页 |
·实验与讨论 | 第74-84页 |
·实验数据 | 第74-76页 |
·算法评价准则 | 第76-77页 |
·实验结果分析 | 第77-84页 |
·本章小结 | 第84-85页 |
第5章 基于稀疏表示的视频和图像分类与识别 | 第85-122页 |
·引言 | 第85-86页 |
·压缩感知与稀疏表示 | 第86-89页 |
·压缩感知理论简介 | 第86-87页 |
·稀疏编码与稀疏表示 | 第87-89页 |
·基于组稀疏表示的图像分类 | 第89-107页 |
·Bag-of-SIFT-words图像特征提取 | 第91-95页 |
·基于组稀疏表示的图像分类 | 第95-99页 |
·实验分析与讨论 | 第99-107页 |
·基于非负组稀疏表示的人脸识别 | 第107-121页 |
·测试样本的非负组稀疏表示 | 第110-112页 |
·基于非负组稀疏表示的分类和识别方法 | 第112-113页 |
·实验分析与讨论 | 第113-121页 |
·本章小结 | 第121-122页 |
第6章 总结与展望 | 第122-125页 |
·总结 | 第122-123页 |
·展望 | 第123-125页 |
参考文献 | 第125-140页 |
攻读博士学位期间主要的研究成果 | 第140-142页 |
致谢 | 第142-143页 |