摘要 | 第3-5页 |
ABSTRACT | 第5-7页 |
第一章 绪论 | 第15-23页 |
1.1 应用背景 | 第15页 |
1.2 语音可懂度增强技术发展概述 | 第15-16页 |
1.3 语音主客观评测 | 第16-20页 |
1.3.1 语音质量评测 | 第17-18页 |
1.3.2 语音可懂度评测 | 第18-20页 |
1.4 论文主要工作与结构 | 第20-23页 |
第二章 语音分段提取耳蜗熵值 | 第23-43页 |
2.1 语音听觉机理及数字模型 | 第24-29页 |
2.1.1 语音信号的听觉模型 | 第24-25页 |
2.1.2 语音信号的感知 | 第25-26页 |
2.1.3 语音信号的数字模型 | 第26-29页 |
2.2 语音分段 | 第29-34页 |
2.2.1 基于短时能量和过零率的语音分段 | 第29-30页 |
2.2.2 基于语音自相关函数的语音分段 | 第30-31页 |
2.2.3 基于小波变换的语音分段 | 第31-32页 |
2.2.4 基于梅尔倒谱系数的语音分段 | 第32-34页 |
2.3 耳蜗熵值 | 第34-43页 |
2.3.1 耳蜗的结构和原理 | 第34-36页 |
2.3.2 听觉滤波器 | 第36-39页 |
2.3.3 耳蜗熵值提取算法 | 第39-43页 |
第三章 语音库 | 第43-49页 |
3.1 IEEE句子 | 第43-44页 |
3.2 语音库的录制 | 第44-49页 |
3.2.1 噪声抑制算法 | 第44-45页 |
3.2.2 多通道混响语音和抗混响语音算法 | 第45-47页 |
3.2.3 主观评测 | 第47-49页 |
第四章 语音可懂度算法 | 第49-61页 |
4.1 侵入式归一化协方差算法 | 第49-53页 |
4.2 非侵入式语音混响调制能量比算法 | 第53-61页 |
4.2.1 调制频谱特征提取 | 第53-56页 |
4.2.2 调制频谱解析 | 第56-59页 |
4.2.3 混响调制能量比算法 | 第59-61页 |
第五章 算法结果与结论 | 第61-77页 |
5.1 相关度评测标准 | 第61-63页 |
5.1.1 Pearson相关系数 | 第61-62页 |
5.1.2 Spearman秩相关系数 | 第62页 |
5.1.3 S形映射函数 | 第62-63页 |
5.1.4 均方根误差估计 | 第63页 |
5.2 耳蜗熵阈值的选取 | 第63-64页 |
5.3 相关度分析 | 第64-68页 |
5.3.1 传统NCM与基于CSE的NCM算法结果 | 第64-66页 |
5.3.2 传统SRMR与基于CSE的SRMR算法结果 | 第66-67页 |
5.3.3 NCM和SRMR算法结果 | 第67-68页 |
5.4 散点图比较 | 第68-74页 |
5.4.1 传统NCM与基于CSE的NCM算法散点图 | 第68-70页 |
5.4.2 传统SRMR与基于CSE的SRMR算法散点图 | 第70-72页 |
5.4.3 NCM和SRMR算法散点图 | 第72-74页 |
5.5 结论 | 第74-77页 |
5.5.1 提取耳蜗熵值 | 第74-75页 |
5.5.2 侵入式与非侵入式算法效果 | 第75-77页 |
第六章 总结与展望 | 第77-79页 |
6.1 当前工作总结 | 第77页 |
6.2 未来工作展望 | 第77-79页 |
参考文献 | 第79-83页 |
致谢 | 第83-85页 |
攻硕期间取得的研究成果 | 第85页 |