基于计算听觉场景分析的双说话人混合语音分离研究

摘要	第4-6页
ABSTRACT	第6-7页
第一章绪论	第10-14页
1.1 研究背景与意义	第10-11页
1.2 语音分离研究现状	第11-13页
1.3 研究内容	第13页
1.4 论文的组织结构	第13-14页
第二章计算听觉场景分析研究的相关技术	第14-25页
2.1 听觉场景分析	第14-15页
2.2 计算听觉场景分析	第15-18页
2.2.1 基本概念	第15-16页
2.2.2 理论依据	第16页
2.2.3 系统模型	第16-18页
2.3 外围处理模型	第18-22页
2.3.1 人耳听觉系统	第18-19页
2.3.2 模拟人耳的滤波器	第19-21页
2.3.3 语音信号谐波特性计算	第21-22页
2.4 聚类分析	第22-24页
2.4.1 类的定义	第22-23页
2.4.2 基于类内类间距离的分类	第23页
2.4.3 用于聚类计算的特征提取	第23-24页
2.5 本章小结	第24-25页
第三章基于隐马尔科夫模型的多基音跟踪算法	第25-35页
3.1 引言	第25页
3.2 研究现状	第25页
3.3 基于多基音跟踪算法的同时组织	第25-31页
3.3.1 外围处理和通道选择	第25-26页
3.3.2 计算时间顿内基音个数	第26-28页
3.3.3 模型描述	第28-29页
3.3.4 时频单元标记	第29-31页
3.4 实验结果与分析	第31-34页
3.4.1 实验语料	第31页
3.4.2 实验结果与分析	第31-34页
3.5 本章小结	第34-35页
第四章基于聚类的序列组合	第35-44页
4.1 引言	第35-36页
4.2 研究现状	第36页
4.3 系统框架	第36-37页
4.4 聚类过程	第37-39页
4.4.1 目标函数	第37-38页
4.4.2 搜索最佳分类	第38-39页
4.4.3 重新合成语音模块	第39页
4.5 实验结果与分析	第39-43页
4.5.1 数据集	第39-40页
4.5.2 参数确定	第40-41页
4.5.3 多说话人语音分离实验	第41-42页
4.5.4 实验结果分析	第42-43页
4.6 本章小结	第43-44页
第五章总结与展望	第44-47页
5.1 论文工作总结	第44-45页
5.2 工作展望	第45-47页
参考文献	第47-51页
致谢	第51-52页
攻读硕士学位期间发表的论文情况	第52页