基于计算声场景分析的混叠语音分离研究
第一章 引言 | 第1-13页 |
第一节 声场景分析简介 | 第8-11页 |
1.1.1 初级分析 | 第8-10页 |
1.1.2 以图式为基础的知觉组织 | 第10-11页 |
第二节 研究现状及存在的难点 | 第11-12页 |
第三节 本课题研究内容与目标 | 第12-13页 |
第二章 语音信号预处理 | 第13-19页 |
第一节 相位相关技术用于判断话者数目 | 第13-16页 |
第二节 清浊音端点切分 | 第16-19页 |
第三章 基于听觉模型的基音提取 | 第19-39页 |
第一节 听觉生理结构 | 第19-23页 |
3.1.1 外耳 | 第19-20页 |
3.1.2 中耳 | 第20页 |
3.1.3 内耳 | 第20-22页 |
3.1.4 基底膜的行波振动 | 第22-23页 |
第二节 听觉模型 | 第23-27页 |
第三节 单个及含噪语音的基音提取 | 第27-30页 |
第四节 双话者语音的基音跟踪 | 第30-34页 |
第五节 声源数目确定 | 第34-35页 |
第六节 连续语音的基音跟踪 | 第35-39页 |
第四章 混叠语音分离 | 第39-50页 |
第一节 谐波增强与压缩 | 第39-45页 |
4.1.1 系统结构 | 第39-41页 |
4.1.2 帧间匹配 | 第41-42页 |
4.1.3 实验结果分析 | 第42-45页 |
第二节 基于空间定位语音分离方法的探索 | 第45-49页 |
4.2.1 听觉定位机理 | 第45-48页 |
4.2.2 基于空间定位语音分离的探索 | 第48-49页 |
第三节 小结 | 第49-50页 |
第五章 总结与展望 | 第50-55页 |
第一节 系统特征及其创新之处 | 第50-51页 |
第二节 系统局限性 | 第51-52页 |
第三节 进一步了解声场景分析 | 第52-54页 |
第四节 进一步要做的工作 | 第54-55页 |
参考文献 | 第55-58页 |