首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

复杂音频环境下的音频事件检测和语义分析研究

摘要第1-6页
ABSTRACT第6-11页
第1章 引言第11-19页
   ·研究背景和意义第11-12页
   ·研究现状和主要成果第12-13页
   ·常用基本框架和技术第13-17页
     ·基于有监督学习的检测和分析框架第14-15页
     ·基于无监督学习的检测和分析框架第15-16页
     ·有监督方法和无监督方法比较第16-17页
   ·存在的问题第17页
   ·论文结构第17-19页
第2章 基于SVM的单一音频事件检测研究第19-35页
   ·引言第19页
   ·系统流程第19-20页
   ·特征第20-22页
     ·MFCC(Mel-frequency cepstral coefficients)第20页
     ·线谱对(linear spectrum pair)第20-21页
     ·频域能量(frequency energy)第21页
     ·过零率(zero cross ratio)第21-22页
   ·SVM分类器第22-25页
   ·有限状态机平滑第25-26页
   ·不平衡数据集研究第26-30页
     ·模糊样本集修剪技术第27-29页
     ·指导型欠采样技术第29-30页
   ·实验及讨论第30-33页
     ·SVM分类器分类效果分析第30-31页
     ·平滑效果分析第31-32页
     ·不平衡数据集分析第32-33页
   ·小结第33-35页
第3章 关键音频事件检测研究第35-47页
   ·引言第35页
   ·整体检测框架第35-36页
   ·特征第36-38页
     ·子带能量比(band energy ratio)第37页
     ·频率中心(frequency centroid)第37页
     ·带宽(bandwidth)第37页
     ·子带频谱流量(subband spectral flux)第37-38页
     ·差分特征第38页
   ·分类器第38-41页
     ·决策树原理和方法第38-40页
     ·Adaboost算法第40-41页
   ·多级检测策略第41-42页
   ·平滑处理第42页
   ·实验结果和分析第42-46页
     ·实验数据第43页
     ·评价准则第43页
     ·爆炸声检测结果第43-44页
     ·基于Adaboost的决策树模型效果分析第44-45页
     ·多层检索策略结果分析第45-46页
   ·结论第46-47页
第4章 基于无监督的关键音频事件提取和场景分割技术第47-65页
   ·引言第47页
   ·总体设计第47-49页
   ·特征提取第49-50页
     ·高过零率(high zero cross ratio)第49页
     ·低能量率(low energy ratio)第49-50页
     ·频谱流量(spectral flux)第50页
     ·静音帧比例(silence ratio)第50页
   ·谱聚类第50-52页
     ·基于内容的幅度因子第51-52页
     ·迭代谱聚类第52页
   ·平滑第52页
   ·基于单音频的音频事件权重计算第52-54页
   ·基于TF-IDF的音频事件权重计算第54-57页
     ·音频事件相似度计算第55-56页
     ·音频事件权重计算第56-57页
   ·音频场景分割第57-59页
     ·语义关联和置信度第58-59页
     ·分割准则第59页
   ·实验和讨论第59-64页
     ·音频事件提取第60-61页
     ·基于单音频的关键音频事件提取第61-62页
     ·基于TF-IDF的音频事件权重计算第62-63页
     ·音频场景分割第63-64页
   ·结论第64-65页
第5章 总结与展望第65-68页
   ·论文总结第65-66页
   ·研究展望第66-68页
参考文献第68-73页
致谢第73-74页
攻读学位期间发表的学术论文目录第74页

论文共74页,点击 下载论文
上一篇:基于文档频率的分级主题模型
下一篇:基于内容的图像检索系统研究