摘要 | 第5-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第12-24页 |
1.1 研究背景及意义 | 第12-13页 |
1.2 国内外研究现状及发展动态分析 | 第13-21页 |
1.3 论文的研究内容与章节安排 | 第21-24页 |
第2章 语音活动检测与噪声估计基础理论 | 第24-52页 |
2.1 语音与噪声基本信号模型 | 第24-29页 |
2.1.1 语音与噪声信号的特性 | 第24-26页 |
2.1.2 语音与噪声信号模型及预处理 | 第26-29页 |
2.2 几种经典的理论方法 | 第29-39页 |
2.2.1 基于短时特征分析的方法 | 第30-31页 |
2.2.2 基于最小统计的噪声功率谱估计 | 第31-34页 |
2.2.3 基于最小控制递归的噪声功率谱估计 | 第34-39页 |
2.2.4 基于深度神经网络的语音活动检测 | 第39页 |
2.3 语音出现概率和噪声功率谱估计在语音增强中的作用 | 第39-47页 |
2.3.1 人耳感知特性 | 第40页 |
2.3.2 谱减法 | 第40-41页 |
2.3.3 维纳滤波 | 第41-43页 |
2.3.4 基于信号子空间的语音增强 | 第43-44页 |
2.3.5 基于OM-LSA的语音增强 | 第44-47页 |
2.4 实验数据库的建立 | 第47-48页 |
2.5 性能评价方法 | 第48-51页 |
2.5.1 噪声估计误差评价 | 第48-49页 |
2.5.2 基于语音增强的间接评价 | 第49-51页 |
2.6 本章小结 | 第51-52页 |
第3章 基于高斯混合模型的非监督离线建模 | 第52-66页 |
3.1 引言 | 第52页 |
3.2 子带语音与非语音分布特征 | 第52-53页 |
3.3 基于GMM的建模方法 | 第53-55页 |
3.4 基于二元GMM的语音功率谱包络建模 | 第55-56页 |
3.5 高斯混合模型参数估计 | 第56-58页 |
3.6 模型的约束 | 第58-60页 |
3.7 聚类方法实现 | 第60-61页 |
3.8 性能评价 | 第61-64页 |
3.8.1 实验设置 | 第61页 |
3.8.2 实验结果 | 第61-64页 |
3.9 本章小结 | 第64-66页 |
第4章 基于隐马尔可夫模型的非监督离线建模 | 第66-78页 |
4.1 引言 | 第66页 |
4.2 基于HMM的对数功率谱建模 | 第66-69页 |
4.3 HMM的参数估计 | 第69-70页 |
4.4 模型的约束 | 第70-71页 |
4.5 噪声功率谱包络的提取 | 第71-72页 |
4.6 聚类方法实现 | 第72页 |
4.7 性能评价 | 第72-76页 |
4.7.1 实验设置 | 第72-73页 |
4.7.2 实验结果 | 第73-76页 |
4.8 本章小结 | 第76-78页 |
第5章 基于高斯混合模型的非监督在线建模 | 第78-88页 |
5.1 引言 | 第78页 |
5.2 基于GMM的在线建模方法 | 第78-79页 |
5.3 基于极大似然的在线参数估计 | 第79-81页 |
5.4 基于MDL准则的在线约束 | 第81-82页 |
5.5 聚类方法实现 | 第82-83页 |
5.6 性能评价 | 第83-86页 |
5.6.1 实验设置 | 第83页 |
5.6.2 实验结果 | 第83-86页 |
5.7 本章小结 | 第86-88页 |
第6章 基于隐马尔可夫模型的非监督在线建模 | 第88-104页 |
6.1 引言 | 第88页 |
6.2 基于HMM的对数谱包络建模 | 第88-89页 |
6.3 HMM参数估计 | 第89-92页 |
6.4 模型的约束 | 第92-93页 |
6.5 聚类方法实现 | 第93-94页 |
6.6 性能评价 | 第94-103页 |
6.6.1 语音出现概率估计 | 第94-96页 |
6.6.2 时序相关性对于语音出现概率估计的影响 | 第96-97页 |
6.6.3 噪声估计误差与语音增强 | 第97-103页 |
6.7 本章小结 | 第103-104页 |
第7章 总结与展望 | 第104-108页 |
7.1 本文的主要贡献和创新 | 第104-106页 |
7.2 下一步的研究展望 | 第106-108页 |
参考文献 | 第108-120页 |
主要符号缩写 | 第120-122页 |
攻读博士学位期间发表的论文及研究成果 | 第122-124页 |
攻读博士学位期间参加的科研项目 | 第124-125页 |
致谢 | 第125-126页 |
作者简介 | 第126页 |