摘要 | 第4-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第10-14页 |
1.1 引言 | 第10页 |
1.2 研究目的和意义 | 第10-11页 |
1.2.1 研究目的 | 第10页 |
1.2.2 研究意义 | 第10-11页 |
1.3 国内外研究现状 | 第11-12页 |
1.4 论文章节概要 | 第12-14页 |
第2章 语音增强方法基础理论与知识 | 第14-19页 |
2.1 基础理论分析 | 第14页 |
2.2 语音增强分类 | 第14-18页 |
2.2.1 多通道语音增强方法 | 第14-15页 |
2.2.2 自适应滤波语音增强方法 | 第15-16页 |
2.2.3 谱减语音增强方法 | 第16页 |
2.2.4 维纳滤波的语音增强方法 | 第16页 |
2.2.5 基于最小均误差的方幅度谱和对数谱估计 | 第16-17页 |
2.2.6 基于深度神经网络的方法 | 第17-18页 |
2.3 本章小结 | 第18-19页 |
第3章 藏语拉萨话基础及实验数据准备 | 第19-22页 |
3.1 藏语语音增强和相关知识探讨 | 第19页 |
3.2 藏语拉萨话语音基本特征 | 第19-20页 |
3.2.1 藏语的演变 | 第19页 |
3.2.2 藏语发音 | 第19-20页 |
3.2.3 藏语拉萨话分类和选取 | 第20页 |
3.3 藏语语料库和噪音库的准备 | 第20-21页 |
3.4 本章小结 | 第21-22页 |
第4章 经典单通道语音增强 | 第22-35页 |
4.1 语音信号预处理概要 | 第22-25页 |
4.1.1 预滤波、预加重、采样 | 第22页 |
4.1.2 语音信号的分帧加窗 | 第22-23页 |
4.1.3 语音信号特征提取 | 第23页 |
4.1.4 语音端点检测(VoiceActivityDetection,VAD) | 第23-25页 |
4.2 自适应滤波器语音增强 | 第25-27页 |
4.2.1 自适应滤波LMS算法原理 | 第25-26页 |
4.2.2 LMS语音增强系统运行原理 | 第26-27页 |
4.3 谱减法语音增强 | 第27-29页 |
4.3.1 谱减法基本原理 | 第27-28页 |
4.3.2 谱减法语音增强系统 | 第28-29页 |
4.4 维纳滤波语音增强 | 第29-32页 |
4.4.1 维纳滤波原理 | 第29-31页 |
4.4.2 维纳滤波系统 | 第31-32页 |
4.5 最小均方误差幅度域和对数域语音增强 | 第32-33页 |
4.6 本章小结 | 第33-35页 |
第5章 基于深度神经网络的语音增强方法 | 第35-46页 |
5.1 深度神经网络语音增强探讨和分析 | 第35页 |
5.2 深度神经网络的发展 | 第35页 |
5.3 深度神经网络基本原理 | 第35-37页 |
5.4 受限制玻尔兹曼机以及受限制玻尔兹曼机的初始化 | 第37-40页 |
5.4.1 受限制玻尔兹曼机 | 第37-39页 |
5.4.2 玻尔兹曼机初始化 | 第39-40页 |
5.5 深度神经网络训练 | 第40-43页 |
5.5.1 无监督DBN的训练 | 第40-42页 |
5.5.2 深度神经网络通过误差反向传播调优 | 第42-43页 |
5.6 深度神经网络的语音增强系统 | 第43-44页 |
5.7 本章小结 | 第44-46页 |
第6章 实验分析及结果 | 第46-55页 |
6.1 实验过程 | 第46-50页 |
6.1.1 语音检测指标 | 第46-48页 |
6.1.2 实验内容 | 第48-50页 |
6.2 实验结果比较与分析 | 第50-53页 |
6.2.1 SSNR的结果的比较分析 | 第50页 |
6.2.2 LPD和PESQ结果的比较分析 | 第50-52页 |
6.2.3 增强后的语音识别系统率的比较分析 | 第52-53页 |
6.2.4 MOS平均主观判断得分比较 | 第53页 |
6.3 实验结论 | 第53-54页 |
6.4 本章小结 | 第54-55页 |
第7章 总结和展望 | 第55-57页 |
7.1 全文总结 | 第55-56页 |
7.2 未来研究展望 | 第56-57页 |
参考文献 | 第57-61页 |
附录 | 第61-62页 |
致谢 | 第62页 |