摘要 | 第5-7页 |
ABSTRACT | 第7-9页 |
第一章 绪论 | 第12-20页 |
1.1 研究的背景与意义 | 第12-14页 |
1.2 国内外研究现状 | 第14-18页 |
1.3 研究难点 | 第18-19页 |
1.4 研究内容以及论文安排 | 第19-20页 |
第二章 音频事件检测算法概述 | 第20-28页 |
2.1 引言 | 第20页 |
2.2 音频事件检测系统简介 | 第20-21页 |
2.2.1 分帧加窗 | 第20-21页 |
2.2.2 特征提取 | 第21页 |
2.3 数据库概述 | 第21-22页 |
2.4 常用特征概述 | 第22-25页 |
2.4.1 时域特征 | 第22页 |
2.4.2 频域特征 | 第22-24页 |
2.4.3 音频信号的时频域特征 | 第24-25页 |
2.4.4 MPEG-7标准中定义的特征 | 第25页 |
2.5 分类模型 | 第25-26页 |
2.6 算法评价准则 | 第26页 |
2.7 本章小结 | 第26-28页 |
第三章 基于长短时特征的音频事件检测研究 | 第28-50页 |
3.1 引言 | 第28-29页 |
3.2 短时特征抽取研究 | 第29-33页 |
3.2.1 色度相关特征介绍 | 第29-31页 |
3.2.2 频谱相关特征介绍 | 第31-32页 |
3.2.3 MFCC、Mel Energies、Log Mel Energies等 | 第32-33页 |
3.3 长时特征抽取研究 | 第33-34页 |
3.4 特征选择 | 第34-35页 |
3.5 分类器简介 | 第35-43页 |
3.5.1 高斯混合模型(GMM) | 第35-37页 |
3.5.2 深度神经网络(DNN) | 第37-39页 |
3.5.3 支持向量机(SVM) | 第39-42页 |
3.5.4 随机森林(Random Forest) | 第42-43页 |
3.6 实验结果汇总及分析 | 第43-47页 |
3.7 本章小结 | 第47-50页 |
第四章 基于图谱法的音频事件检测研究 | 第50-60页 |
4.1 引言 | 第50页 |
4.2 图谱生成 | 第50-52页 |
4.2.1 声谱图 | 第50-52页 |
4.2.2 色度特征图 | 第52页 |
4.3 深度卷积神经网络 | 第52-54页 |
4.3.1 卷积神经网络介绍 | 第52-53页 |
4.3.2 卷积神经网络具体参数 | 第53-54页 |
4.4 实验结果汇总与分析 | 第54-57页 |
4.5 本章小结 | 第57-60页 |
第五章 总结与展望 | 第60-64页 |
5.1 论文总结 | 第60-61页 |
5.2 论文展望 | 第61-64页 |
参考文献 | 第64-68页 |
致谢 | 第68-70页 |
攻读学位期间发表的学术论文目录 | 第70页 |