首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

基于生成对抗网络的端到端多语音分离技术研究

摘要第5-7页
abstract第7-8页
第1章 绪论第11-19页
    1.1 课题的背景及研究意义第11-12页
    1.2 课题发展历史及国内外研究现状第12-16页
        1.2.1 语音分离问题概述第12-13页
        1.2.2 语音分离技术发展历史第13-15页
        1.2.3 深度学习在语音分离方面的研究现状第15-16页
        1.2.4 生成对抗网络的研究现状第16页
    1.3 本文主要内容及章节安排第16-19页
第2章 语音分离相关方法及声学特征提取第19-31页
    2.1 语音分离方法概述第19-24页
        2.1.1 传统语音分离方法第19-20页
        2.1.2 基于深度学习的语音分离方法第20-24页
    2.2 传统音频特征及提取相关方法第24-30页
        2.2.1 频谱图第25-28页
        2.2.2 梅尔频率倒谱系数第28-29页
        2.2.3 本文拟采用的音频特征第29-30页
    2.3 本章小结第30-31页
第3章 基于生成对抗网络实现多语音分离模型第31-57页
    3.1 生成对抗网络的基本原理第31-36页
        3.1.1 生成对抗网络的模型动机第31-33页
        3.1.2 模型原理的数学物理描述第33-36页
    3.2 选择生对对抗网络的理论依据及改进第36-37页
    3.3 基于生成对抗网络的端到端多语音分离模型结构第37-38页
    3.4 实现语音分离关键问题的解决方案第38-56页
        3.4.1 语音信号预处理第38-43页
        3.4.2 多语音分离目标掩码设置第43-44页
        3.4.3 数据扩张第44-45页
        3.4.4 语音分离系统的生成模型(Generator)第45-52页
        3.4.5 语音分离系统的判别模型(Discriminator)第52-56页
    3.5 本章总结第56-57页
第4章 实验结果与分析第57-74页
    4.1 实验环境准备第57页
    4.2 实验数据集建立第57-59页
    4.3 基于生成对抗网络的端到端多语音分离模型实验结果第59-65页
    4.4 对比实验分析第65-72页
        4.4.1 不同输入帧长对语音分离效果影响第65-66页
        4.4.2 不同输入特征对语音分离效果的影响第66-68页
        4.4.3 不同生成模型语音分离效果对比第68页
        4.4.4 不同判别模型中损失函数的效果对比第68-69页
        4.4.5 不同深度学习网络模型的语音分离效果对比第69-72页
    4.5 本章小结第72-74页
结论第74-76页
参考文献第76-82页
攻读硕士学位期间发表的论文和取得的科研成果第82-84页
致谢第84页

论文共84页,点击 下载论文
上一篇:异构网络中基于MPTCP多径传输的数据包调度机制研究
下一篇:自动跟随机器人研究及其测试系统开发