故事视频的语义分析与提取
摘要 | 第1-7页 |
ABSTRACT | 第7-14页 |
第一章 绪论 | 第14-36页 |
·故事视频语义分析的意义 | 第14页 |
·相关的MPEG国际标准 | 第14-16页 |
·视频检索关键技术及研究现状 | 第16-28页 |
·基本概念 | 第17页 |
·视频的结构分析 | 第17-20页 |
·视频摘要 | 第20页 |
·视频语义的分析和提取 | 第20-22页 |
·视频数据模型 | 第22-24页 |
·视频数据索引及视频检索 | 第24-25页 |
·目前已出现的原型系统 | 第25-28页 |
·TRECVID测评 | 第28-29页 |
·论文的主要内容和创新点 | 第29-31页 |
参考文献 | 第31-36页 |
第二章 全局运动特征的提取和描述 | 第36-50页 |
·引言 | 第36-37页 |
·运动特征提取的相关工作 | 第37-38页 |
·六参数运动模型的简化 | 第38-41页 |
·视频的运动分割 | 第41-44页 |
·Zoom运动分割 | 第42-43页 |
·Pan运动分割 | 第43-44页 |
·Tilt运动分割 | 第44页 |
·运动信息的XML描述 | 第44-45页 |
·全局运动视频检索框架 | 第45-47页 |
·基于示例的视频检索 | 第46-47页 |
·基于Xquery的关键词查询 | 第47页 |
·本章总结 | 第47-48页 |
参考文献 | 第48-50页 |
第三章 基于多层次特征描述和SVM的镜头边界检测 | 第50-70页 |
·引言 | 第50页 |
·镜头边界检测的相关工作 | 第50-54页 |
·镜头边界检测策略 | 第54-57页 |
·特征选取和帧间差距离的度量 | 第54-56页 |
·上下文特征矢量的构成 | 第56-57页 |
·支持向量机分类 | 第57页 |
·镜头边界检测算法 | 第57-60页 |
·切变检测算法 | 第58页 |
·渐变检测算法 | 第58-60页 |
·实验及评估 | 第60-66页 |
·训练集的建立 | 第61页 |
·支持向量机的构造 | 第61-62页 |
·结果评估 | 第62-65页 |
·结果分析 | 第65-66页 |
·本章总结 | 第66页 |
参考文献 | 第66-70页 |
第四章 视觉显著对象的选择性提取 | 第70-92页 |
·引言 | 第70-71页 |
·对象提取的相关工作 | 第71-72页 |
·图像颜色的矢量量化 | 第72-77页 |
·同等组滤波 | 第73-74页 |
·颜色的矢量量化 | 第74-75页 |
·颜色量化的实验结果 | 第75-77页 |
·图像分割 | 第77-81页 |
·图像粗分割 | 第77页 |
·区域融合 | 第77-79页 |
·融合中止 | 第79-80页 |
·Gestalt原则和J-图 | 第80-81页 |
·视觉注意模型 | 第81-86页 |
·Itti模型的改进 | 第82页 |
·显著图的产生 | 第82-86页 |
·显著对象提取 | 第86-87页 |
·实验结果 | 第87-88页 |
·本章总结 | 第88-89页 |
参考文献 | 第89-92页 |
第五章 基于电影结构模型和感知线索的分层视频摘要 | 第92-116页 |
·引言 | 第92-94页 |
·电影结构 | 第94-96页 |
·结构分析的相关工作 | 第94页 |
·三幕框架 | 第94-95页 |
·情节点 | 第95页 |
·幕的结构 | 第95-96页 |
·电影结构的计算模型─NP模型 | 第96-99页 |
·NP跨度 | 第96-97页 |
·场景边界检测 | 第97-98页 |
·场景类型确定 | 第98页 |
·NP边界确定 | 第98-99页 |
·感知注意力模型 | 第99-105页 |
·角色和镜头类型 | 第99-100页 |
·光和色彩 | 第100页 |
·摄像机运动 | 第100-102页 |
·动作和对象运动 | 第102-103页 |
·对话和字幕检测 | 第103页 |
·声轨和声强 | 第103-104页 |
·注意力模型的融合 | 第104-105页 |
·分层的视频摘要 | 第105-108页 |
·情感刺激量和场景重要性 | 第105-106页 |
·视频摘要产生框架 | 第106-108页 |
·实验和评估 | 第108-113页 |
·电影结构模型评估 | 第109-110页 |
·静态摘要评估 | 第110-112页 |
·动态缩略评估 | 第112-113页 |
·本章总结 | 第113页 |
参考文献 | 第113-116页 |
第六章 基于社会网络和电影本体的影片内容理解 | 第116-151页 |
·引言 | 第116-118页 |
·影片内容分析的相关工作 | 第118-119页 |
·电影结构和类型影片 | 第119-120页 |
·电影结构模型 | 第119页 |
·类型影片 | 第119-120页 |
·电影本体 | 第120-122页 |
·电影的社会网络分析 | 第122-127页 |
·角色的社会网络 | 第122-125页 |
·角色的职业分类及社会职责 | 第125-126页 |
·角色身份和社会关系的确定 | 第126-127页 |
·基于分层事件检测的内容理解框架 | 第127-137页 |
·故事线检测 | 第128-129页 |
·分层动作事件检测 | 第129-131页 |
·语音事件检测 | 第131-133页 |
·对话文本摘要算法 | 第133-136页 |
·影片内容描述和规范 | 第136-137页 |
·实验及讨论 | 第137-143页 |
·人脸检测与识别 | 第137页 |
·说话人识别和OCR | 第137-138页 |
·角色的社会网络分析结果 | 第138页 |
·故事线检测结果 | 第138-139页 |
·社区划分、性别识别及职业推测 | 第139-140页 |
·电影事件检测结果 | 第140-143页 |
·本章总结 | 第143-144页 |
参考文献 | 第144-151页 |
第七章 总结与展望 | 第151-154页 |
·论文工作总结 | 第151-153页 |
·未来工作建议 | 第153-154页 |
致谢 | 第154-155页 |
攻读博士期间发表的论文目录 | 第155页 |