| 摘要 | 第3-4页 |
| Abstract | 第4页 |
| 1 绪论 | 第7-11页 |
| 1.1 论文研究背景和意义 | 第7-8页 |
| 1.2 音乐自动分类研究方法现状 | 第8页 |
| 1.3 西洋乐器自动分类技术的发展及研究现状 | 第8-9页 |
| 1.4 论文结构安排和创新点 | 第9-11页 |
| 2 音乐信号量 | 第11-20页 |
| 2.1 音乐的基本物理量 | 第11-13页 |
| 2.1.1 频率 | 第11-13页 |
| 2.1.2 谱能量 | 第13页 |
| 2.2 音乐学领域的信号量 | 第13-15页 |
| 2.2.1 音调 | 第13页 |
| 2.2.2 响度 | 第13-15页 |
| 2.2.3 音色 | 第15页 |
| 2.3 音乐生理学 | 第15-19页 |
| 2.3.1 人耳听觉特性模型 | 第15-16页 |
| 2.3.2 听觉临界频带 | 第16-18页 |
| 2.3.3 听觉掩蔽效应 | 第18-19页 |
| 2.4 本章小结 | 第19-20页 |
| 3 音乐自动分类介绍 | 第20-33页 |
| 3.1 音乐信号特征提取 | 第20-26页 |
| 3.1.1 时域特征 | 第20-21页 |
| 3.1.2 频域特征 | 第21-22页 |
| 3.1.3 MFCC特征参数 | 第22-26页 |
| 3.2 深度神经网络理论 | 第26-32页 |
| 3.2.1 神经元模型 | 第26-27页 |
| 3.2.2 误差逆传播算法 | 第27-30页 |
| 3.2.3 受限玻尔兹曼机 | 第30-32页 |
| 3.2.4 深度学习 | 第32页 |
| 3.3 本章小结 | 第32-33页 |
| 4 基于自建字典库的西洋乐器音乐稀疏表示 | 第33-59页 |
| 4.1 过完备字典稀疏表示理论简介 | 第33-34页 |
| 4.2 稀疏表示字典库选择 | 第34-42页 |
| 4.2.1 传统字典库 | 第34-37页 |
| 4.2.2 本文创建的字典库 | 第37-42页 |
| 4.3 稀疏分解算法 | 第42-48页 |
| 4.3.1 稀疏分解算法的研究现状 | 第42-43页 |
| 4.3.2 凸松弛算法 | 第43-45页 |
| 4.3.3 贪婪匹配追踪算法 | 第45-48页 |
| 4.4 实验结果及分析 | 第48-58页 |
| 4.4.1 实验1钢琴音乐信号基于本文所构字典库重构效果 | 第49-50页 |
| 4.4.2 实验2吉他音乐信号基于本文所构字典库重构效果 | 第50-52页 |
| 4.4.3 实验3小提琴音乐信号基于本文所构字典库重构效果 | 第52-53页 |
| 4.4.4 实验4萨克斯音乐信号基于本文所构字典库重构效果 | 第53-55页 |
| 4.4.5 实验5竖笛音乐信号基于本文所构字典库重构效果 | 第55-56页 |
| 4.4.6 实验6百音盒音乐信号基于本文所构字典库重构效果 | 第56-58页 |
| 4.5 本章小结 | 第58-59页 |
| 5 基于稀疏表示和深度神经网络模型的西洋乐器自动分类 | 第59-74页 |
| 5.1 DBN神经网络结构 | 第59-62页 |
| 5.1.1 RBM参数设置 | 第59页 |
| 5.1.2 对比散度快速学习算法 | 第59-60页 |
| 5.1.3 预训练及微调 | 第60-61页 |
| 5.1.4 softmax分类器 | 第61-62页 |
| 5.2 深度神经网络工作站配置 | 第62-63页 |
| 5.3 音乐样本库的建立 | 第63-64页 |
| 5.4 西洋乐器音乐信号特征表示 | 第64-67页 |
| 5.4.1 预处理 | 第64-66页 |
| 5.4.2 稀疏特征提取 | 第66-67页 |
| 5.5 实验分析与结果 | 第67-73页 |
| 实验1:微调迭代次数对深度神经网络模型的影响 | 第67-68页 |
| 实验2:隐藏层数及隐藏层结点数对深度神经网络模型的影响 | 第68-71页 |
| 实验3:稀疏特征与深度神经网络结合的分类结果 | 第71-73页 |
| 5.6 本章小结 | 第73-74页 |
| 6 总结与展望 | 第74-76页 |
| 专利申请情况 | 第76-77页 |
| 致谢 | 第77-78页 |
| 参考文献 | 第78-80页 |