摘要 | 第8-10页 |
ABSTRACT | 第10-11页 |
第一章 绪论 | 第12-22页 |
1.1 研究背景和研究意义 | 第12-13页 |
1.2 国内外研究现状 | 第13-19页 |
1.2.1 传统语音增强算法的发展 | 第13-14页 |
1.2.2 有监督语音增强技术发展 | 第14-18页 |
1.2.3 深度神经网络语音增强技术发展 | 第18-19页 |
1.3 本文组织结构 | 第19-20页 |
1.4 本文研究成果 | 第20-22页 |
第二章 基于深度神经网络的语音增强算法原理 | 第22-34页 |
2.1 语音模型 | 第22-24页 |
2.1.1 噪声分类 | 第22页 |
2.1.2 语音质量评价 | 第22-24页 |
2.1.2.1 PESQ原理 | 第23页 |
2.1.2.2 分段信噪比(SegSNR) | 第23页 |
2.1.2.3 对数谱距离(LSD) | 第23-24页 |
2.2 传统基于回归深度神经网络的语音增强 | 第24-31页 |
2.2.1 模型预训练 | 第25-28页 |
2.2.2 Gibbs采样算法 | 第28-29页 |
2.2.3 参数更新 | 第29页 |
2.2.4 精细调优 | 第29-31页 |
2.3 既有的基于深度神经网络语音增强方法 | 第31-33页 |
2.3.1 传统算法与深度神经网络相结合 | 第32页 |
2.3.2 其他预训练模型 | 第32-33页 |
2.4 本章小结 | 第33-34页 |
第三章 提高深度神经网络语音增强算法泛化能力 | 第34-43页 |
3.1 引言 | 第34页 |
3.2 提升回归深度神经网络泛化能力 | 第34-38页 |
3.2.1 Dropout正则化技术 | 第34-36页 |
3.2.2 稀疏约束正则化技术 | 第36-37页 |
3.2.3 规则化参数 | 第37-38页 |
3.3 提升模型泛化能力的正则化技术效率 | 第38-42页 |
3.4 本章小节 | 第42-43页 |
第四章 降低存储开销和去除残留稳态噪声 | 第43-50页 |
4.1 权值共享和压缩 | 第43-45页 |
4.1.1 权值共享和量化 | 第43-44页 |
4.1.2 数据压缩 | 第44-45页 |
4.1.3 回归深度神经网络加速训练 | 第45页 |
4.2 深度神经网络压缩效率 | 第45-47页 |
4.3 后处理去除稳态噪声 | 第47-49页 |
4.4 本章小结 | 第49-50页 |
第五章 语音增强系统设计与实现 | 第50-58页 |
5.1 Matlab语音处理 | 第50-54页 |
5.1.1 基于Matlab深度神经网络语音处理技术 | 第50-51页 |
5.1.2 语音信号分析 | 第51页 |
5.1.3 语音信号预处理 | 第51-52页 |
5.1.4 语音信号重构 | 第52-53页 |
5.1.5 Matlab软件系统框架及开发流程 | 第53-54页 |
5.2 基于MATLAB回归深度神经网络语音增强算法语音结果分析 | 第54-57页 |
5.2.1 语音质量评价 | 第54-55页 |
5.2.2 时域波形图 | 第55-57页 |
5.3 本章小结 | 第57-58页 |
第六章 总结与展望 | 第58-60页 |
6.1 本文工作总结 | 第58-59页 |
6.2 本文研究课题的下一步工作和展望 | 第59-60页 |
致谢 | 第60-62页 |
参考文献 | 第62-66页 |
作者在学期间取得的学术成果 | 第66-67页 |
中英文对照表 | 第67页 |