近似视频检索及重复视频检测

摘要	第4-5页
ABSTRACT	第5页
目录	第7-10页
第一章绪论	第10-15页
1.1 课题研究背景和意义	第10-12页
1.2 国内外研究现状	第12-13页
1.3 本文的工作和安排	第13-15页
1.3.1 主要研究内容	第13-14页
1.3.2 论文结构安排	第14-15页
第二章基于内容的重复音视频检测系统	第15-34页
2.1 引言	第15页
2.2 重复音视频检测系统概述	第15-18页
2.2.1 重复音视频检测的关键技术	第15-17页
2.2.2 重复音视频检测系统框架	第17-18页
2.3 视频全局分块特征——CAM区域量化	第18-21页
2.3.1 视频特征提取	第18页
2.3.2 时间窗内的局部归一化	第18-20页
2.3.3 特征的选择	第20页
2.3.4 量化	第20-21页
2.3.5 针对视频变换的预处理	第21页
2.4 音频WASF特征	第21-26页
2.4.1 音频前处理	第22-25页
2.4.2 特征计算	第25页
2.4.3 音频后处理	第25-26页
2.5 索引结构	第26-29页
2.6 重复音视频检测的融合算法	第29-31页
2.7 实验结果和分析	第31-32页
2.7.1 实验数据	第31页
2.7.2 评测标准	第31页
2.7.3 评测结果及分析比较	第31-32页
2.8 本章小结	第32-34页
第三章基于内容的近似视频检索系统	第34-57页
3.1 引言	第34页
3.2 近似视频检索系统概述	第34-39页
3.2.1 近似视频检索的关键技术	第34-37页
3.2.2 近似视频检索系统框架	第37-39页
3.3 镜头分割	第39-40页
3.4 全局特征	第40-43页
3.4.1 全局颜色特征—HSV相关图	第40页
3.4.2 全局颜色特征—LAB直方图	第40-41页
3.4.3 全局纹理特征—LBP直方图	第41-42页
3.4.4 基于镜头的运动活动度特征	第42-43页
3.5 主持人检测	第43-48页
3.5.1 人脸区域检测	第44-45页
3.5.2 特征提取	第45-46页
3.5.3 层次聚类	第46-47页
3.5.4 主持人镜头判别	第47-48页
3.6 SIFT特征	第48-51页
3.7 索引结构	第51-54页
3.7.1 BoW模型	第51-52页
3.7.2 Fisher向量模型	第52-54页
3.8 实验结果与分析	第54-55页
3.8.1 实验数据	第54页
3.8.2 评测标准	第54页
3.8.3 评测结果及分析比较	第54-55页
3.9 本章小结	第55-57页
第四章总结与展望	第57-59页
4.1 论文总结	第57-58页
4.1.1 基于内容的重复视频检测	第57页
4.1.2 基于内容的近似视频检索	第57-58页
4.2 工作展望	第58-59页
参考文献	第59-62页
致谢	第62页