音频场景分析与识别方法研究

摘要	第4-5页
Abstract	第5-6页
第1章绪论	第10-15页
1.1 课题背景	第10-12页
1.2 本文研究工作	第12-13页
1.3 论文结构	第13-15页
第2章音频分析与识别研究	第15-21页
2.1 引言	第15页
2.2 音频摘要	第15-17页
2.3 声音分类和识别	第17-19页
2.4 音频场景感知	第19-20页
2.5 本章小结	第20-21页
第3章音频特征提取	第21-35页
3.1 引言	第21页
3.2 Mel频率倒谱系数音频特征	第21-25页
3.3 基于小波包分解的音频特征学习与提取	第25-32页
3.3.1 音频小波包分解	第25-27页
3.3.2 LDB算法	第27-30页
3.3.3 基于boosting的特征选择	第30-31页
3.3.4 基于随机森林的特征选择	第31-32页
3.4 基于词典的音频特征	第32-33页
3.5 Pseudo-Semantic特征	第33-34页
3.6 本章小结	第34-35页
第4章音频场景建模与分类	第35-56页
4.1 引言	第35页
4.2 音频场景建模	第35-36页
4.3 基于HMM的音频场景分类	第36-45页
4.3.1 概率图模型	第36-39页
4.3.2 HMM模型	第39-44页
4.3.3 使用HMM模型进行音频场景分类	第44-45页
4.4 基于高斯混合模型的音频场景分类	第45-51页
4.4.1 高斯混合模型	第45-50页
4.4.2 使用高斯混合模型进行音频场景分类	第50-51页
4.5 基于随机森林的音频场景分类	第51-55页
4.5.1 随机森林模型	第52-54页
4.5.2 使用随机森林进行音频场景分类	第54-55页
4.6 本章小结	第55-56页
第5章实验结果	第56-67页
5.1 实验数据	第56页
5.2 基于HMM的分类	第56-59页
5.2.1 基于场景HMM的音频场景分类	第57-58页
5.2.2 基于音效和场景HMM的音频场景分类	第58-59页
5.3 基于随机森林的分类	第59-61页
5.3.1 直接使用场景数据分类	第59-60页
5.3.2 利用音效提取音频伪语义特征建模	第60-61页
5.4 基于高斯混合模型的分类	第61-62页
5.5 分类方法结果对比	第62-66页
5.6 本章小结	第66-67页
第6章结束语	第67-69页
6.1 本文成果	第67-68页
6.2 未来展望	第68-69页
致谢	第69-70页
参考文献	第70-75页
附录	第75-76页
附录A 攻读硕士学位期间参加的科研项目	第75页
附录B 攻读硕士学位期间发表的学术论文	第75-76页