摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第1章 绪论 | 第10-17页 |
1.1 课题背景及研究的目的和意义 | 第10页 |
1.2 国内外研究现状 | 第10-15页 |
1.2.1 声学特征分析研究现状 | 第10-12页 |
1.2.2 音频场景识别研究现状 | 第12-13页 |
1.2.3 深度神经网络的研究现状 | 第13-15页 |
1.3 研究内容 | 第15-17页 |
第2章 基于MFCC和KNN的场景识别基线系统 | 第17-28页 |
2.1 引言 | 第17页 |
2.2 基本流程、预处理及特征提取 | 第17-19页 |
2.2.1 基线系统基本流程 | 第17页 |
2.2.2 音频信号预处理及特征提取 | 第17-19页 |
2.3 场景识别 | 第19-25页 |
2.3.1 K近邻算法的理论基础及算法流程 | 第20-21页 |
2.3.2 KNN模型及基本要素 | 第21-24页 |
2.3.3 K近邻算法应用 | 第24-25页 |
2.4 实验结果及分析 | 第25-26页 |
2.4.1 实验数据 | 第25-26页 |
2.4.2 实验参数调整及结果分析 | 第26页 |
2.5 本章小结 | 第26-28页 |
第3章 基于卷积神经网络的音频特征提取及场景识别 | 第28-47页 |
3.1 引言 | 第28页 |
3.2 现有音频特征在场景识别方面的适用性分析 | 第28-29页 |
3.3 基于CNN的深层特征提取原理及学习算法 | 第29-34页 |
3.3.1 CNN拓扑结构 | 第29-30页 |
3.3.2 CNN计算方式 | 第30-31页 |
3.3.3 CNN学习算法 | 第31-34页 |
3.4 基于CNN的场景特征提取及识别分析 | 第34-37页 |
3.4.1 语谱图的特性以及CNN方法的适用性 | 第34-36页 |
3.4.2 卷积滤波器的设计 | 第36-37页 |
3.4.3 特征提取及分类 | 第37页 |
3.5 实验过程及结果分析 | 第37-46页 |
3.5.1 实验数据 | 第37-38页 |
3.5.2 实验基本网络结构 | 第38页 |
3.5.3 实验参数调整及结果分析 | 第38-42页 |
3.5.4 实验流程及中间结果分析 | 第42-46页 |
3.6 本章小结 | 第46-47页 |
第4章 基于解卷积神经网络的音频特征提取及场景识别 | 第47-59页 |
4.1 引言 | 第47页 |
4.2 基于解卷积神经网络的特征分析 | 第47-53页 |
4.2.1 解卷积神经网络的拓扑结构 | 第48页 |
4.2.2 解卷积神经网络的计算方式 | 第48-52页 |
4.2.3 解卷积神经网络的学习算法 | 第52-53页 |
4.3 解卷积神经网络用于音频场景的特征分析及识别算法 | 第53-55页 |
4.3.1 解卷积神经网络的适用性分析 | 第53-55页 |
4.3.2 解卷积神经网络用于音频场景特征提取及识别算法 | 第55页 |
4.4 实验结果及分析 | 第55-57页 |
4.4.1 实验数据预处理 | 第55页 |
4.4.2 实验基本网络结构 | 第55-56页 |
4.4.3 实验参数调整及结果分析 | 第56-57页 |
4.5 本章小结 | 第57-59页 |
结论 | 第59-60页 |
参考文献 | 第60-65页 |
致谢 | 第65页 |