基于计算听觉场景分析的单通道语音分离研究
摘要 | 第5-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第12-27页 |
1.1 人耳系统的听觉场景分析 | 第12-14页 |
1.1.1 人耳的听觉感知系统 | 第12-13页 |
1.1.2 听觉场景分析的发展 | 第13-14页 |
1.2 浊音信号与清音信号 | 第14-15页 |
1.3 计算听觉场景分析的发展 | 第15-23页 |
1.3.1 CASA模型发展 | 第15-18页 |
1.3.2 听觉掩蔽效应 | 第18-19页 |
1.3.3 单通道CASA系统发展 | 第19-23页 |
1.4 CASA系统的应用前景 | 第23-24页 |
1.5 单通道CASA语音分离系统的课题难点 | 第24-25页 |
1.6 本文的主要内容和章节安排 | 第25-27页 |
第2章 听觉外围处理和特征提取 | 第27-37页 |
2.1 引言 | 第27页 |
2.2 听觉外围处理 | 第27-32页 |
2.3 响应包络提取 | 第32-33页 |
2.4 特征提取 | 第33-35页 |
2.5 本章小结 | 第35-37页 |
第3章 基于改进阈值的语音分块方法 | 第37-51页 |
3.1 引言 | 第37页 |
3.2 语音分块概述 | 第37-38页 |
3.3 清音分块 | 第38-41页 |
3.3.1 平滑 | 第38-39页 |
3.3.2 起始/结束语音时间匹配 | 第39-40页 |
3.3.3 语音块整合 | 第40-41页 |
3.4 基于改进阈值的浊音分块 | 第41-50页 |
3.4.1 基于改进阈值的能量提取 | 第41-45页 |
3.4.2 阈值改进算法评估 | 第45-50页 |
3.5 本章小结 | 第50-51页 |
第4章 基于目标源的迭代基音跟踪算法 | 第51-66页 |
4.1 引言 | 第51页 |
4.2 传统基音提取算法 | 第51-54页 |
4.2.1 基于自相关的基音提取算法 | 第51-52页 |
4.2.2 基于AMDF的基音提取算法 | 第52-53页 |
4.2.3 基于倒谱的基音提取算法 | 第53-54页 |
4.3 HuWang06基音跟踪算法 | 第54-56页 |
4.4 基于目标源的迭代基音跟踪算法 | 第56-59页 |
4.4.1 初始基音估计 | 第57页 |
4.4.2 根据基音标记目标源 | 第57-58页 |
4.4.3 根据目标源计算基音 | 第58-59页 |
4.5 改进算法评估 | 第59-64页 |
4.5.1 算法实现 | 第59-61页 |
4.5.2 算法比较 | 第61-64页 |
4.6 本章小结 | 第64-66页 |
第5章 基于改进清音分离方法的目标源聚类 | 第66-77页 |
5.1 引言 | 第66页 |
5.2 浊音分离 | 第66-68页 |
5.3 传统清音分离方法 | 第68-71页 |
5.3.1 基于特征分类的清音分离方法 | 第68-69页 |
5.3.2 基于CASA和谱减的清音分离方法 | 第69-71页 |
5.4 基于CASA和谱减的改进清音分离方法 | 第71-76页 |
5.4.1 改进算法原理 | 第71-73页 |
5.4.2 改进算法评估 | 第73-76页 |
5.5 本章小结 | 第76-77页 |
第6章 基于形态学图像处理的掩码平滑 | 第77-89页 |
6.1 引言 | 第77页 |
6.2 形态学图像处理 | 第77-79页 |
6.2.1 膨胀 | 第77-78页 |
6.2.2 腐蚀 | 第78-79页 |
6.3 基于形态学图像处理的改进掩码平滑方法 | 第79-82页 |
6.3.1 基于形态学的去噪 | 第80-81页 |
6.3.2 基于形态学的修补 | 第81-82页 |
6.4 改进算法评估 | 第82-87页 |
6.4.1 算法实现 | 第82-84页 |
6.4.2 算法比较 | 第84-87页 |
6.5 本章小结 | 第87-89页 |
第7章 基于浊音目标源的双语音分离 | 第89-98页 |
7.1 引言 | 第89页 |
7.2 基于浊音目标源的双语音分离 | 第89-90页 |
7.3 系统评估 | 第90-97页 |
7.4 本章小结 | 第97-98页 |
第8章 结论与展望 | 第98-101页 |
8.1 全文总结 | 第98-99页 |
8.2 研究展望 | 第99-101页 |
参考文献 | 第101-110页 |
致谢 | 第110-111页 |
附录一 发表及在审稿论文 | 第111页 |