首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

深度学习在音乐自动标注中的应用

致谢第5-6页
摘要第6-7页
ABSTRACT第7页
缩略词表第11-12页
1 引言第12-19页
    1.1 研究背景第12-13页
        1.1.1 音乐标注基本概念第12-13页
        1.1.2 深度学习第13页
    1.2 国内外研究现状第13-18页
        1.2.1 传统的音乐标注方式第13-15页
        1.2.2 音频特征提取第15页
        1.2.3 深度学习在音乐领域的应用第15-17页
        1.2.4 深度学习在音乐标注领域的应用第17-18页
    1.3 本文重点研究内容第18页
    1.4 论文结构安排第18-19页
2 相关技术介绍第19-35页
    2.1 音频信号特征表达第19-22页
        2.1.1 梅尔倒谱系数第19-20页
        2.1.2 频谱图第20-22页
    2.2 深度学习第22-34页
        2.2.1 卷积神经网络第22-26页
        2.2.2 优化方法第26-33页
        2.2.3 正则化第33-34页
    2.3 本章小结第34-35页
3 模型结构设计和平台搭建第35-46页
    3.1 数据集第35页
    3.2 问题描述第35-36页
    3.3 模型设计思路第36-38页
        3.3.1 输入信号第36-37页
        3.3.2 卷积层窗口和轴第37页
        3.3.3 池化层的大小和轴第37-38页
        3.3.4 损失函数定义第38页
    3.4 模型结构第38-42页
        3.4.1 梅尔频谱系数模型第38-39页
        3.4.2 频谱图模型第39-41页
        3.4.3 原始音频模型第41-42页
    3.5 深度学习平台搭建第42-45页
        3.5.1 深度学习平台第42-44页
        3.5.2 软件安装第44-45页
        3.5.3 硬件第45页
    3.6 本章小结第45-46页
4 实验结果和讨论第46-58页
    4.1 模型训练以及收敛的细节第46-52页
        4.1.1 不同训练速率对于训练收敛过程的影响第46-49页
        4.1.2 不同梯度下降方法对于训练速度的影响第49-52页
    4.2 模型表现的对比第52-56页
        4.2.1 不同模型的对比第53-55页
        4.2.2 与相关工作的对比第55-56页
    4.3 不同深度的模型在MSD上的表现第56-57页
    4.4 本章小结第57-58页
5 卷积神经网络可视化第58-62页
    5.1 模型可视化的思路第58页
    5.2 卷积神经网络可视化的一般模型结构第58页
    5.3 可视化模型的损失函数定义第58-59页
    5.4 可视化模型的训练方式第59-60页
    5.5 梅尔频谱图模型的可视化效果第60-62页
6 结论和展望第62-63页
参考文献第63-66页
作者简历及攻读硕士/博士学位期间取得的研究成果第66-68页
学位论文数据集第68页

论文共68页,点击 下载论文
上一篇:调节TLR9信号通路或中性粒细胞表面TLR9表达对小鼠全身性炎症应答综合征的影响
下一篇:sTLR9~+中性粒细胞在TLR9介导小鼠致死性休克全身炎症应答中的作用