基于视听通道融合的多媒体暴力片段检测方法研究

摘要	第4-5页
Abstract	第5-6页
目录	第7-9页
第1章绪论	第9-15页
1.1 课题背景、研究目的和意义	第9-10页
1.2 国内外相关研究现状	第10-13页
1.2.1 镜头分割研究现状	第10-11页
1.2.2 暴力片段检测研究现状	第11-13页
1.2.3 当前研究存在的问题	第13页
1.3 本文研究内容及章节安排	第13-15页
第2章镜头单元定义与数据分割	第15-30页
2.1 引言	第15-19页
2.1.1 基于颜色直方图的镜头分割技术	第16-18页
2.1.2 基于像素差的镜头分割技术	第18页
2.1.3 基于边缘特征的镜头分割技术	第18-19页
2.2 基于语谱图的音频分割技术研究	第19-27页
2.2.1 语谱图技术原理	第20-21页
2.2.2 基于语谱图的音频分割算法	第21-27页
2.3 基于直方图双阈值和语谱图联合镜头分割方法	第27-29页
2.4 本章小结	第29-30页
第3章多媒体内容特征分析与提取	第30-45页
3.1 音频内容特征分析与提取	第30-35页
3.1.1 短时特征提取	第30-32页
3.1.2 长时特征提取	第32-35页
3.2 视频内容特征分析与提取	第35-44页
3.2.1 基于 SES 的运动矢量特征提取	第35-38页
3.2.2 HSV 颜色空间特征提取	第38-41页
3.2.3 镜头中人肤色特征提取	第41-42页
3.2.4 图像中边缘特征分析与提取	第42-44页
3.3 本章小结	第44-45页
第4章基于音视频特征融合的暴力镜头检测	第45-50页
4.1 引言	第45页
4.2 数据库简介	第45-47页
4.3 基于音频、视频单通道的暴力镜头检测	第47页
4.4 基于音视频特征融合的暴力镜头检测	第47-49页
4.5 本章小结	第49-50页
第5章基于高层语义特征的暴力程度分级	第50-61页
5.1 引言	第50页
5.2 基于时延网络的暴力音频事件检测	第50-55页
5.2.1 时间集成	第51-53页
5.2.2 帧间集成	第53-54页
5.2.3 基于时延网络的暴力音频事件检测研究	第54-55页
5.3 暴力视频场景检测	第55-57页
5.4 基于高层语义的暴力程度等级评价	第57-58页
5.5 基于视听通道融合的暴力片段检测系统实现	第58-59页
5.6 本章小结	第59-61页
结论	第61-63页
参考文献	第63-69页
攻读学位期间发表的学术论文	第69-71页
致谢	第71页