基于深度学习的语音分离研究

摘要	第4-6页
ABSTRACT	第6-8页
第一章引言	第15-29页
1.1 课题的背景和意义	第15-17页
1.2 语音分离问题概述及相关方法	第17-19页
1.3 有监督的语音分离方法	第19-26页
1.3.1 输入特征	第20-21页
1.3.2 训练目标	第21-23页
1.3.3 学习器	第23-26页
1.4 研究内容与结构安排	第26-29页
第二章深度学习框架下的语音分离	第29-47页
2.1 训练数据生成	第29-31页
2.2 时频分解	第31-33页
2.3 目标计算与特征抽取	第33-34页
2.4 模型训练	第34-35页
2.5 波形合成	第35-36页
2.6 性能评估	第36-37页
2.7 比较研究	第37-45页
2.7.1 实验配置	第37-38页
2.7.2 使用深度神经网络的语音分离系统	第38-42页
2.7.3 使用循环神经网络的语音分离系统	第42-45页
2.8 本章小结	第45-47页
第三章多目标融合的单声道语音分离	第47-55页
3.1 引言	第47页
3.2 多目标融合方法	第47-50页
3.2.1 分离模型	第47-48页
3.2.2 输出融合	第48-50页
3.3 实验	第50-53页
3.4 本章小结	第53-55页
第四章基于卷积网络的鲁棒性基音估计	第55-63页
4.1 引言	第55-56页
4.2 基音估计方法	第56-59页
4.2.1 选取候选基音	第57-58页
4.2.2 用卷积神经网络检测基音状态	第58页
4.2.3 基音追踪	第58-59页
4.3 实验	第59-62页
4.3.1 实验数据	第59-60页
4.3.2 实验评估	第60-61页
4.3.3 实验对比	第61-62页
4.4 本章小结	第62-63页
第五章语音分离和基音估计联合算法	第63-81页
5.1 引言	第63-64页
5.2 算法描述	第64页
5.3 特征抽取	第64-66页
5.4 系统描述	第66-70页
5.4.1 理想二值掩蔽估计	第66-68页
5.4.2 基音估计	第68页
5.4.3 联合算法	第68-70页
5.5 实验	第70-79页
5.5.1 实验配置	第70-72页
5.5.2 性能对比	第72-73页
5.5.3 实验分析	第73-79页
5.6 本章小结	第79-81页
第六章单声道和多声道语音增强联合算法	第81-91页
6.1 引言	第81-82页
6.2 联合算法	第82-85页
6.3 实验	第85-89页
6.4 本章小结	第89-91页
第七章总结与展望	第91-95页
7.1 本文工作总结	第91-92页
7.2 未来工作展望	第92-95页
附录A 语音分离系统性能指标	第95-99页
参考文献	第99-113页
致谢	第113-115页
攻读学位期间发表的学术论文	第115-117页
攻读学位期间参与的项目	第117页