首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于概率潜在语义分析的音频场景识别方法

摘要第4-6页
Abstract第6-7页
第1章 绪论第10-18页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-16页
        1.2.1 音频场景的特征提取第12-13页
        1.2.2 音频场景识别方法第13-16页
    1.3 本文的主要研究内容第16-18页
第2章 基于 MFCC 长时特征和支持向量机的音频场景识别方法第18-29页
    2.1 概述第18页
    2.2 MFCC 特征向量提取第18-21页
    2.3 支持向量机模型基本理论第21-26页
        2.3.1 最优分类面第21-24页
        2.3.2 线性不可分情况第24-25页
        2.3.3 支持向量机第25-26页
    2.4 基于长时特征和 SVM 模型的音频场景识别方法第26-28页
        2.4.1 语料特点第26-27页
        2.4.2 实验结果第27-28页
    2.5 本章小结第28-29页
第3章 基于概率潜在语义分析的音频场景识别方法第29-43页
    3.1 概述第29-31页
    3.2 高斯混合模型基本理论第31-33页
        3.2.1 GMM 模型描述第31-32页
        3.2.2 GMM 模型训练第32页
        3.2.3 EM 算法估计 GMM 参数第32-33页
    3.3 概率潜在语义分析模型基本理论第33-37页
        3.3.1 模型背景及优点第33-34页
        3.3.2 构建 PLSA 模型第34-35页
        3.3.3 期望最大化算法训练 PLSA 模型第35-37页
    3.4 基于概率潜在语义分析模型的音频场景识别方法第37-40页
        3.4.1 构建声学事件类字典第37-40页
        3.4.2 PLSA 模型训练和识别第40页
    3.5 实验结果与讨论第40-42页
    3.6 本章小结第42-43页
第4章 基于近邻传播聚类算法和音频分割的系统改进第43-53页
    4.1 概述第43-44页
    4.2 近邻传播聚类算法基本理论第44-49页
        4.2.1 近邻传播聚类算法特点第44页
        4.2.2 近邻传播聚类算法流程第44-47页
        4.2.3 近邻传播聚类算法性质第47-49页
    4.3 基于 AP 算法和音频分割的音频场景识别系统改进第49-52页
        4.3.1 系统改进详细步骤第49-51页
        4.3.2 实验结果第51-52页
    4.4 本章小结第52-53页
结论第53-54页
参考文献第54-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:基于图像识别技术的商标信息查询系统
下一篇:复杂背景下运动目标的检测与跟踪