基于深度学习的语音质量评价方法研究
摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第8-14页 |
1.1 研究背景与意义 | 第8页 |
1.2 语音质量评价研究现状 | 第8-13页 |
1.2.1 主观评价方法 | 第8-10页 |
1.2.2 客观评价方法 | 第10-13页 |
1.3 本文的主要工作与内容安排 | 第13-14页 |
2 语音质量评价基本知识 | 第14-24页 |
2.1 语音信号产生的数学模型 | 第14-18页 |
2.2 语音质量映射方法 | 第18-23页 |
2.2.1 贝叶斯分类器 | 第18-19页 |
2.2.2 高斯混合模型 | 第19-20页 |
2.2.3 隐马尔科夫模型 | 第20页 |
2.2.4 支持向量机 | 第20-21页 |
2.2.5 神经网络 | 第21-23页 |
2.3 语音质量评价系统性能指标 | 第23-24页 |
3 语音质量评价系统特征提取 | 第24-36页 |
3.1 预处理与语音活动检测 | 第24-26页 |
3.2 改进的Gammatone频率倒谱系数特征 | 第26-31页 |
3.3 感知线性预测倒谱系数特征 | 第31-36页 |
4 基于深度学习的语音质量评价 | 第36-48页 |
4.1 深度学习概述 | 第36-40页 |
4.1.1 深度学习的提出与发展 | 第36-37页 |
4.1.2 选择深度学习的必要性 | 第37-38页 |
4.1.3 深度学习的数据表示与典型结构 | 第38-40页 |
4.2 深度信念网络DBN | 第40-48页 |
4.2.1 受限玻尔兹曼机RBM模型 | 第40-42页 |
4.2.2 对比散度学习法 | 第42-45页 |
4.2.3 基于DBN的语音质量评价 | 第45-48页 |
5 系统实现与分析 | 第48-57页 |
5.1 系统组成框架 | 第48-49页 |
5.2 语音库与实验环境 | 第49页 |
5.3 系统评价结果 | 第49-57页 |
5.3.1 深度信念网络DBN参数设置 | 第50-52页 |
5.3.2 基于深度信念网的系统性能 | 第52-53页 |
5.3.3 模糊支持向量机 | 第53-55页 |
5.3.4 基于模糊支持向量机的系统性能 | 第55-56页 |
5.3.5 两种系统性能对比 | 第56-57页 |
结论 | 第57-58页 |
参考文献 | 第58-62页 |
攻读硕士学位期间发表学术论文情况 | 第62-63页 |
致谢 | 第63-64页 |