复杂音频环境下的音频事件检测和语义分析研究

摘要	第1-6页
ABSTRACT	第6-11页
第1章引言	第11-19页
·研究背景和意义	第11-12页
·研究现状和主要成果	第12-13页
·常用基本框架和技术	第13-17页
·基于有监督学习的检测和分析框架	第14-15页
·基于无监督学习的检测和分析框架	第15-16页
·有监督方法和无监督方法比较	第16-17页
·存在的问题	第17页
·论文结构	第17-19页
第2章基于SVM的单一音频事件检测研究	第19-35页
·引言	第19页
·系统流程	第19-20页
·特征	第20-22页
·MFCC(Mel-frequency cepstral coefficients)	第20页
·线谱对(linear spectrum pair)	第20-21页
·频域能量(frequency energy)	第21页
·过零率(zero cross ratio)	第21-22页
·SVM分类器	第22-25页
·有限状态机平滑	第25-26页
·不平衡数据集研究	第26-30页
·模糊样本集修剪技术	第27-29页
·指导型欠采样技术	第29-30页
·实验及讨论	第30-33页
·SVM分类器分类效果分析	第30-31页
·平滑效果分析	第31-32页
·不平衡数据集分析	第32-33页
·小结	第33-35页
第3章关键音频事件检测研究	第35-47页
·引言	第35页
·整体检测框架	第35-36页
·特征	第36-38页
·子带能量比(band energy ratio)	第37页
·频率中心(frequency centroid)	第37页
·带宽(bandwidth)	第37页
·子带频谱流量(subband spectral flux)	第37-38页
·差分特征	第38页
·分类器	第38-41页
·决策树原理和方法	第38-40页
·Adaboost算法	第40-41页
·多级检测策略	第41-42页
·平滑处理	第42页
·实验结果和分析	第42-46页
·实验数据	第43页
·评价准则	第43页
·爆炸声检测结果	第43-44页
·基于Adaboost的决策树模型效果分析	第44-45页
·多层检索策略结果分析	第45-46页
·结论	第46-47页
第4章基于无监督的关键音频事件提取和场景分割技术	第47-65页
·引言	第47页
·总体设计	第47-49页
·特征提取	第49-50页
·高过零率(high zero cross ratio)	第49页
·低能量率(low energy ratio)	第49-50页
·频谱流量(spectral flux)	第50页
·静音帧比例(silence ratio)	第50页
·谱聚类	第50-52页
·基于内容的幅度因子	第51-52页
·迭代谱聚类	第52页
·平滑	第52页
·基于单音频的音频事件权重计算	第52-54页
·基于TF-IDF的音频事件权重计算	第54-57页
·音频事件相似度计算	第55-56页
·音频事件权重计算	第56-57页
·音频场景分割	第57-59页
·语义关联和置信度	第58-59页
·分割准则	第59页
·实验和讨论	第59-64页
·音频事件提取	第60-61页
·基于单音频的关键音频事件提取	第61-62页
·基于TF-IDF的音频事件权重计算	第62-63页
·音频场景分割	第63-64页
·结论	第64-65页
第5章总结与展望	第65-68页
·论文总结	第65-66页
·研究展望	第66-68页
参考文献	第68-73页
致谢	第73-74页
攻读学位期间发表的学术论文目录	第74页