首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于多维特征提取的视频内容识别系统设计与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
缩略词表第11-12页
1 引言第12-22页
    1.1 研究背景及意义第12-14页
    1.2 国内外研究现状第14-19页
        1.2.1 视频目标检测第14-15页
        1.2.2 图像分类和视频分类第15-16页
        1.2.3 音频内容识别第16-17页
        1.2.4 图像与音频综合的视频内容识别第17-18页
        1.2.5 镜头边界检测第18-19页
    1.3 本论文的主要研究内容与贡献第19-20页
    1.4 本论文的组织结构第20-22页
2 论文相关知识介绍第22-36页
    2.1 开发平台第22-24页
        2.1.1 视频处理平台第22-23页
        2.1.2 机器学习平台第23页
        2.1.3 深度学习平台第23-24页
    2.2 传统图像特征第24-28页
        2.2.1 RGB特征第25页
        2.2.2 方向梯度直方图第25-26页
        2.2.3 尺度不变特征变换第26-28页
    2.3 音频特征第28-29页
        2.3.1 短时过零率第28-29页
        2.3.2 短时傅里叶变换和色度特征第29页
    2.4 机器学习算法第29-33页
        2.4.1 决策树与随机森林第30-32页
        2.4.2 支持向量机第32-33页
    2.5 卷积神经网络第33-35页
    2.6 本章小结第35-36页
3 系统设计与数据处理第36-47页
    3.1 系统设计第36-37页
    3.2 数据来源及获取方式第37-39页
    3.3 镜头边界检测第39-43页
        3.3.1 渐变与突变第39-40页
        3.3.2 相邻帧的曼哈顿距离第40页
        3.3.3 曼哈顿距离差分第40-42页
        3.3.4 阈值选择第42-43页
    3.4 数据集分析第43-45页
    3.5 本章小结第45-47页
4 基于深度卷积激活特征的镜头分类第47-59页
    4.1 问题描述第47-48页
    4.2 选择神经网络模型第48-51页
    4.3 镜头的深度卷积激活特征第51-56页
        4.3.1 图像特征第51-54页
        4.3.2 镜头特征第54-56页
    4.4 训练镜头分类器第56-58页
        4.4.1 特征降维第56-57页
        4.4.2 训练分类器第57-58页
    4.5 本章小结第58-59页
5 广告视频内容识别第59-71页
    5.1 利用图像特征进行视频识别第59-63页
        5.1.1 SIFT匹配效果第59-61页
        5.1.2 匹配得分第61-63页
    5.2 利用音频特征进行视频识别第63-67页
        5.2.1 过零率特征匹配第63-64页
        5.2.2 色度特征匹配第64-67页
    5.3 综合图像与音频方法进行视频识别第67-69页
    5.4 本章小结第69-71页
6 总结及展望第71-73页
    6.1 本文工作总结第71-72页
    6.2 未来工作展望第72-73页
参考文献第73-77页
作者简历及攻读硕士学位期间取得的研究成果第77-79页
学位论文数据集第79页

论文共79页,点击 下载论文
上一篇:基于Criminisi和块结构稀疏度的改进图像修复方法研究
下一篇:基于自适应规则模型的复杂事件处理