基于音频特性的语音可懂度评估

摘要	第3-5页
abstract	第5-7页
第一章绪论	第10-16页
1.1 课题来源和意义	第10-12页
1.1.1 语音与语音信号	第11-12页
1.1.2 语音可懂度与语音质量之间的关系	第12页
1.2 语音可懂度评估技术的发展概述	第12-14页
1.3 本文主要研究内容和组织结构	第14-15页
1.4 本章小结	第15-16页
第二章语音音频特征研究	第16-22页
2.1 语音音频理论	第16页
2.2 语音音频特征提取	第16页
2.3 语音主要音频特征	第16-21页
2.3.1 高过零率比例	第17-18页
2.3.2 平均短时能量	第18页
2.3.3 梅尔倒谱系数	第18-20页
2.3.4 线性预测倒谱系数	第20-21页
2.4 本章小结	第21-22页
第三章语音可懂度评估研究	第22-36页
3.1 语音主观评价方法	第22-25页
3.1.1 SRT评分方法	第22-23页
3.1.2 MOS评分方法	第23-24页
3.1.3 DRT评分方法	第24-25页
3.2 传统语音可懂度的客观评估方法	第25-29页
3.2.1 语音可懂度度指数(SII)	第25-26页
3.2.2 归一化协方差方法(NCM)	第26-27页
3.2.3 连贯语音清晰度指数(CSII)	第27-28页
3.2.4 短时客观可懂度(STOI)	第28-29页
3.3 改进的语音可懂度的客观评估方法	第29-34页
3.3.1 短时精细结构评估算法	第29-31页
3.3.2 基于交互信息的语音可懂度评估算法	第31-34页
3.4 本章小结	第34-36页
第四章基于Gammatone滤波频带的语音可懂度评估	第36-46页
4.1 问题描述	第36页
4.2 Gammatone滤波器组介绍	第36-38页
4.3 实验细节介绍	第38-45页
4.3.1 滤波函数频域转换	第38-39页
4.3.2 实验方法	第39-42页
4.3.3 语音材料	第42-43页
4.3.4 实验数据分析	第43-45页
4.3.5 实验总结	第45页
4.4 本章小结	第45-46页
第五章基于RMS分频段的客观可懂度评估	第46-58页
5.1 问题描述	第46页
5.2 语音分段方法	第46-48页
5.2.1 耳蜗熵值语音分段	第46-47页
5.2.2 均方根值语音分段	第47-48页
5.3 语音元音和辅音的研究	第48-50页
5.3.1 辅音对语音可懂度的重要性	第48-49页
5.3.2 元音对语音可懂度的重要性	第49-50页
5.3.3 元辅音过渡段对语音可懂度的影响	第50页
5.4 RMS分频的基本过程	第50-52页
5.5 语音可懂度评估模型研究	第52-53页
5.6 实验结果及仿真	第53-56页
5.7 本章小结	第56-58页
第六章总结与展望	第58-60页
参考文献	第60-66页
致谢	第66-68页
攻读学位期间发表的学术论文目录	第68页