摘要 | 第3-4页 |
Abstract | 第4页 |
1 绪论 | 第7-11页 |
1.1 论文研究背景和意义 | 第7-8页 |
1.2 音乐自动分类研究方法现状 | 第8页 |
1.3 西洋乐器自动分类技术的发展及研究现状 | 第8-9页 |
1.4 论文结构安排和创新点 | 第9-11页 |
2 音乐信号量 | 第11-20页 |
2.1 音乐的基本物理量 | 第11-13页 |
2.1.1 频率 | 第11-13页 |
2.1.2 谱能量 | 第13页 |
2.2 音乐学领域的信号量 | 第13-15页 |
2.2.1 音调 | 第13页 |
2.2.2 响度 | 第13-15页 |
2.2.3 音色 | 第15页 |
2.3 音乐生理学 | 第15-19页 |
2.3.1 人耳听觉特性模型 | 第15-16页 |
2.3.2 听觉临界频带 | 第16-18页 |
2.3.3 听觉掩蔽效应 | 第18-19页 |
2.4 本章小结 | 第19-20页 |
3 音乐自动分类介绍 | 第20-33页 |
3.1 音乐信号特征提取 | 第20-26页 |
3.1.1 时域特征 | 第20-21页 |
3.1.2 频域特征 | 第21-22页 |
3.1.3 MFCC特征参数 | 第22-26页 |
3.2 深度神经网络理论 | 第26-32页 |
3.2.1 神经元模型 | 第26-27页 |
3.2.2 误差逆传播算法 | 第27-30页 |
3.2.3 受限玻尔兹曼机 | 第30-32页 |
3.2.4 深度学习 | 第32页 |
3.3 本章小结 | 第32-33页 |
4 基于自建字典库的西洋乐器音乐稀疏表示 | 第33-59页 |
4.1 过完备字典稀疏表示理论简介 | 第33-34页 |
4.2 稀疏表示字典库选择 | 第34-42页 |
4.2.1 传统字典库 | 第34-37页 |
4.2.2 本文创建的字典库 | 第37-42页 |
4.3 稀疏分解算法 | 第42-48页 |
4.3.1 稀疏分解算法的研究现状 | 第42-43页 |
4.3.2 凸松弛算法 | 第43-45页 |
4.3.3 贪婪匹配追踪算法 | 第45-48页 |
4.4 实验结果及分析 | 第48-58页 |
4.4.1 实验1钢琴音乐信号基于本文所构字典库重构效果 | 第49-50页 |
4.4.2 实验2吉他音乐信号基于本文所构字典库重构效果 | 第50-52页 |
4.4.3 实验3小提琴音乐信号基于本文所构字典库重构效果 | 第52-53页 |
4.4.4 实验4萨克斯音乐信号基于本文所构字典库重构效果 | 第53-55页 |
4.4.5 实验5竖笛音乐信号基于本文所构字典库重构效果 | 第55-56页 |
4.4.6 实验6百音盒音乐信号基于本文所构字典库重构效果 | 第56-58页 |
4.5 本章小结 | 第58-59页 |
5 基于稀疏表示和深度神经网络模型的西洋乐器自动分类 | 第59-74页 |
5.1 DBN神经网络结构 | 第59-62页 |
5.1.1 RBM参数设置 | 第59页 |
5.1.2 对比散度快速学习算法 | 第59-60页 |
5.1.3 预训练及微调 | 第60-61页 |
5.1.4 softmax分类器 | 第61-62页 |
5.2 深度神经网络工作站配置 | 第62-63页 |
5.3 音乐样本库的建立 | 第63-64页 |
5.4 西洋乐器音乐信号特征表示 | 第64-67页 |
5.4.1 预处理 | 第64-66页 |
5.4.2 稀疏特征提取 | 第66-67页 |
5.5 实验分析与结果 | 第67-73页 |
实验1:微调迭代次数对深度神经网络模型的影响 | 第67-68页 |
实验2:隐藏层数及隐藏层结点数对深度神经网络模型的影响 | 第68-71页 |
实验3:稀疏特征与深度神经网络结合的分类结果 | 第71-73页 |
5.6 本章小结 | 第73-74页 |
6 总结与展望 | 第74-76页 |
专利申请情况 | 第76-77页 |
致谢 | 第77-78页 |
参考文献 | 第78-80页 |