首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

面向场景理解的视、听觉媒体内容处理与分析方法研究

摘要第4-5页
Abstract第5-6页
第一章 绪论第11-14页
    1.1 研究背景第11-12页
    1.2 研究工作第12-13页
    1.3 论文结构第13-14页
第二章 研究背景第14-25页
    2.1 音频摘要提取的相关研究第14-18页
        2.1.1 音频的内容第14-15页
        2.1.2 基于相似度的音乐摘要第15-16页
        2.1.3 基于监督学习算法的音频摘要第16-17页
        2.1.4 基于无监督学习算法的音频摘要第17-18页
    2.2 文字增强问题研究现状第18-24页
        2.2.1 基于二值化的文字增强算法第19-21页
        2.2.2 基于超像素的文字增强算法第21-24页
    2.3 本章小结第24-25页
第三章 基于检测声音事件和场景变化的多源音频摘要方法第25-36页
    3.1 算法框架描述第25-27页
    3.2 音频分割第27-29页
    3.3 基于音频事件和上下文模型的音频摘要第29-32页
        3.3.1 音频片段聚类第29-30页
        3.3.2 音频事件检测与识别第30-31页
        3.3.3 基于上下文模型的关联性分析第31-32页
    3.4 实验与讨论第32-35页
    3.5 本章小结第35-36页
第四章 基于多光谱融合的文字增强算法第36-45页
    4.1 方法概述第36页
    4.2 减少退化影响的多光谱图像第36-38页
    4.3 文字帧增强的多光谱融合第38-40页
    4.4 实验与讨论第40-44页
        4.4.1 增强图片质量评价第40-41页
        4.4.2 文字检测评估第41-44页
        4.4.3 文字识别评估第44页
    4.5 本章小结第44-45页
第五章 总结与展望第45-47页
    5.1 本文成果第45-46页
    5.2 未来展望第46-47页
参考文献第47-53页
简历与科研成果第53-55页
致谢第55-56页

论文共56页,点击 下载论文
上一篇:基于Java EE的银行信贷风险管理系统的设计与实现
下一篇:基于先验知识融合的显著性目标检测