首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

基于深度学习的多基频提取研究

摘要第5-7页
Abstract第7-8页
第一章 绪论第11-17页
    1.1 研究目的与意义第11-12页
    1.2 研究现状及问题第12-16页
        1.2.1 主旋律提取(Melody Extraction)第12-14页
        1.2.2 自动音符转写(Automatic Music Transcription)第14-16页
    1.3 研究内容以及论文安排第16-17页
第二章 多基频提取研究概述第17-31页
    2.1 声乐的基本概念第17-21页
        2.1.1 声音的基本特征第17-19页
        2.1.2 音乐的频率特性与度量方法第19-20页
        2.1.3 钢琴概述第20-21页
    2.2 CQT第21-22页
    2.3 深度学习简介第22-24页
    2.4 多基频提取的数据库及其评价指标第24-26页
        2.4.1 主旋律提取的评价指标第24-25页
        2.4.2 音符转写的评价指标第25页
        2.4.3 主旋律提取的实验数据集第25-26页
        2.4.4 自动音符转写的实验数据集第26页
    2.5 问题分析第26-31页
        2.5.1 主旋律提取的问题分析第26-29页
        2.5.2 音符转写的问题分析第29-31页
第三章 基于深度谐波网络(DHNN)的主旋律提取第31-47页
    3.1 主旋律提取方法的整体框架第31-32页
    3.2 SVAD网络第32-35页
        3.2.1 RNN和LSTM网络第33-34页
        3.2.2 MFCC特征第34-35页
        3.2.3 实验结果对比第35页
    3.3 基于DHNN的SPE网络第35-42页
        3.3.1 CNN与Resnet的简单概述第36-39页
        3.3.2 RNN-SPE网络第39-41页
        3.3.3 CNN-SPE网络第41-42页
        3.3.4 后处理—beam search的维特比算法第42页
    3.4 主旋律提取的结果与分析第42-45页
    3.5 本章总结第45-47页
第四章 基于改进DHNN的音符转写算法第47-65页
    4.1 音符转写的整体框架第47-49页
    4.2 基于一维卷积的DHNN model第49-54页
    4.3 Competition model第54-56页
    4.4 Time attention第56-58页
    4.5 Note Tracking第58-62页
    4.6 本章总结第62-65页
第五章 总结与展望第65-67页
    5.1 论文工作总结第65-66页
    5.2 未来研究展望第66-67页
参考文献第67-71页
致谢第71-73页
攻读学位期间发表的学术论文目录第73页

论文共73页,点击 下载论文
上一篇:基于DASH的全景视频传输技术研究
下一篇:ISM频段的频谱预测技术