摘要 | 第1-5页 |
ABSTRACT | 第5-14页 |
缩略词对照表 | 第14-17页 |
1 绪论 | 第17-46页 |
·论文的研究背景 | 第17-21页 |
·镜头边界检测和基于语义的镜头分类方法研究进展 | 第21-28页 |
·视频镜头边界检测方法研究进展 | 第22-24页 |
·基于语义的镜头分类方法研究进展 | 第24-25页 |
·基于语义的音频分类方法研究进展 | 第25-28页 |
·字幕检测、定位、跟踪和分割方法研究进展 | 第28-34页 |
·字幕检测、定位和跟踪方法研究进展 | 第29-33页 |
·字幕分割方法研究进展 | 第33-34页 |
·全局运动估计方法研究进展 | 第34-37页 |
·基于语义的事件和故事单元检测与分类方法研究进展 | 第37-41页 |
·基于语义的体育视频事件检测和分类方法研究进展 | 第37-40页 |
·基于语义的新闻视频故事分类方法研究进展 | 第40-41页 |
·视频摘要、浏览以及视频内容形象化展示技术研究进展 | 第41-43页 |
·本文主要研究内容 | 第43-45页 |
·本文的组织结构 | 第45-46页 |
2 视频编解码标准以及基本的压缩域特征提取 | 第46-56页 |
·引言 | 第46页 |
·视频数据特点以及视频压缩方法的基本出发点 | 第46-47页 |
·H.26L 系列视频编码国际标准 | 第47-48页 |
·H.261 编码标准介绍 | 第47页 |
·H.263、H.263+以及H.263++编码标准介绍 | 第47-48页 |
·MPEG 系列视频编解码国际标准 | 第48-51页 |
·MPEG-1 视频编码标准介绍 | 第48页 |
·MPEG-2 视频编码标准介绍 | 第48-50页 |
·MPEG-4 编码标准介绍 | 第50-51页 |
·H.264/AVC 视频编解码国际标准 | 第51-53页 |
·压缩域中的基本特征提取和分析 | 第53-55页 |
·本章小结 | 第55-56页 |
3 镜头边界检测与基于语义的镜头分类 | 第56-89页 |
·引言 | 第56页 |
·基于AHD 的镜头边界检测 | 第56-71页 |
·基于AHD 的Fade in/out 检测 | 第57-62页 |
·基于AHD 的Flashlight 检测 | 第62-64页 |
·基于AHD 的Cut、Dissolve 检测 | 第64-66页 |
·基于AHD 的Fade in/out 和Flashlight 检测的实验结果分析 | 第66-67页 |
·参数对Fade in/out 以及Flashlight 性能检测影响的讨论 | 第67-68页 |
·基于AHD 的Cut 和Dissolve 检测实验结果 | 第68-70页 |
·小结 | 第70-71页 |
·基于语义的镜头分类 | 第71-76页 |
·足球视频镜头语义分类流程 | 第71-73页 |
·基于摄像机全局运动模式的全景镜头细分类 | 第73-76页 |
·基于语义的足球视频镜头分类实验结果分析 | 第76页 |
·小结 | 第76页 |
·音频数据分类方法 | 第76-86页 |
·音频数据分类的流程框图 | 第76-77页 |
·静音和非静音片段区分方法 | 第77页 |
·基于SR 的纯说话片段和非纯说话片段的区分方法 | 第77-78页 |
·进行非纯说话片段区分时的特征提取 | 第78-83页 |
·基于SVM 的Speech+Noise 和With Music 分类方法 | 第83页 |
·基于SVM 的Speech+Music 和Pure Music 分类方法 | 第83-84页 |
·音频数据分类的实验结果分析 | 第84-85页 |
·不同特征对音频数据分类结果影响讨论 | 第85-86页 |
·小结 | 第86页 |
·本章小结 | 第86-89页 |
4 字幕检测、定位、跟踪、分割以及字幕类型划分方法 | 第89-113页 |
·引言 | 第89页 |
·压缩域信息相关的字幕检测、定位、跟踪、分割和识别方法 | 第89-106页 |
·基于压缩域特征的字幕区域粗检测 | 第89-91页 |
·水平和垂直方向排列的字幕检测和确认 | 第91-93页 |
·字幕定位 | 第93-94页 |
·字幕跟踪 | 第94-98页 |
·基于前背景相结合的字幕分割和识别 | 第98-100页 |
·实验结果分析 | 第100-106页 |
·小结 | 第106页 |
·基于H.264/AVC 压缩域特征的字幕区域检测 | 第106-109页 |
·H.264/AVC 压缩域中的纹理表示与字幕区域检测 | 第107-108页 |
·实验结果分析 | 第108-109页 |
·小结 | 第109页 |
·字幕类型划分 | 第109-112页 |
·本章小结 | 第112-113页 |
5 基于压缩域特征的全局运动估计及其应用 | 第113-136页 |
·引言 | 第113页 |
·基于运动矢量组的全局运动估计方法 | 第113-121页 |
·算法流程 | 第113-114页 |
·在给定模型下基于运动矢量组的全局运动参数计算方法 | 第114-116页 |
·自适应的全局运动模型确定 | 第116-117页 |
·实验结果分析 | 第117-120页 |
·参数选择讨论 | 第120-121页 |
·小结 | 第121页 |
·基于GA 的全局运动估计方法 | 第121-126页 |
·基于GA 的全局运动估计中的适应度函数和个体选择 | 第121-122页 |
·初始种群产生与算法停止条件 | 第122页 |
·基于GA 的全局运动参数优化方法流程 | 第122-123页 |
·实验结果及其分析 | 第123-126页 |
·结论 | 第126页 |
·基于GM/LM 的应用 | 第126-134页 |
·基于GM/LM 的字幕遮挡区域恢复 | 第126-129页 |
·基于GM/LM 的视频错误区域恢复 | 第129-134页 |
·本章小结 | 第134-136页 |
6 事件和故事单元检测、分类以及基于语义的视频浏览系统框架 | 第136-164页 |
·引言 | 第136页 |
·基于语义的足球比赛视频事件检测和分类 | 第136-149页 |
·基于Quasi-Play/Break 的事件边界检测 | 第138-139页 |
·事件片段中观测特征提取 | 第139-140页 |
·基于HMM 的足球视频事件训练和检测 | 第140-141页 |
·基于足球检测结果和足球位置相关的角球、任意球和点球细分 | 第141-143页 |
·精彩事件分类 | 第143-144页 |
·实验结果分析 | 第144-149页 |
·小结 | 第149页 |
·基于语义的新闻视频故事单元分类 | 第149-156页 |
·多模态特征融合在新闻视频故事单元分类中的作用 | 第149-151页 |
·音视频片段同步策略的故事单元边界检测 | 第151-152页 |
·音视频特征结合的新闻故事分类 | 第152-156页 |
·新闻故事分类实验结果分析 | 第156页 |
·小结 | 第156页 |
·基于语义关键词的视频查询和检索 | 第156-157页 |
·基于ToC 的视频内容浏览框架 | 第157-162页 |
·基于ToC 的新闻视频内容浏览框架 | 第158-160页 |
·基于ToC 的足球比赛视频内容浏览框架 | 第160-162页 |
·小结 | 第162页 |
·本章小结 | 第162-164页 |
7 结束语 | 第164-167页 |
致谢 | 第167-168页 |
参考文献 | 第168-179页 |
攻读博士学位期间的研究成果 | 第179-180页 |