摘要 | 第4-6页 |
ABSTRACT | 第6-8页 |
第1章 绪论 | 第16-38页 |
1.1 课题背景及研究的目的和意义 | 第16-18页 |
1.1.1 课题背景 | 第16-17页 |
1.1.2 研究的目的和意义 | 第17-18页 |
1.2 发音质量自动评测方法国内外研究现状 | 第18-33页 |
1.2.1 音段层面的发音质量自动评测 | 第19-27页 |
1.2.2 超音段层面的发音质量自动评测 | 第27-30页 |
1.2.3 代表性的发音质量自动评测系统 | 第30-33页 |
1.3 当前研究中存在的主要问题 | 第33-35页 |
1.4 主要研究内容及论文组织结构安排 | 第35-38页 |
第2章 发音质量自动评测基线系统的构建 | 第38-64页 |
2.1 引言 | 第38页 |
2.2 发音质量自动评测的基本原理 | 第38-39页 |
2.3 基线系统的搭建 | 第39-51页 |
2.3.1 系统结构框架 | 第39-40页 |
2.3.2 发音特征的提取 | 第40-43页 |
2.3.3 发音模型的训练 | 第43-48页 |
2.3.4 发音质量的评测 | 第48-51页 |
2.4 实验用语音数据库 | 第51-54页 |
2.4.1 标准发音语音库 | 第51-52页 |
2.4.2 国家普通话水平测试现场录音语音库 | 第52-54页 |
2.5 发音质量自动评测性能的评价 | 第54-61页 |
2.5.1 相关系数评价方法 | 第55-56页 |
2.5.2 联合错误率评价方法 | 第56-59页 |
2.5.3 分差评价方法 | 第59-61页 |
2.6 基线系统性能及分析 | 第61-63页 |
2.7 本章小结 | 第63-64页 |
第3章 汉语声韵母发音质量自动评测技术 | 第64-91页 |
3.1 引言 | 第64-66页 |
3.2 基于音素混淆概率矩阵的声韵母评测方法 | 第66-73页 |
3.2.1 基本思路 | 第66-67页 |
3.2.2 音素混淆概率矩阵及混淆音素集合 | 第67-69页 |
3.2.3 音素混淆限制识别网络 | 第69-71页 |
3.2.4 音素混淆先验概率 | 第71页 |
3.2.5 后验概率计算空间优化 | 第71-73页 |
3.3 基于扩展发音空间的声韵母评测方法 | 第73-81页 |
3.3.1 基本思路 | 第73页 |
3.3.2 标准发音空间及其扩展 | 第73-75页 |
3.3.3 扩展发音空间中音素模型的建模策略 | 第75-76页 |
3.3.4 错误发音样本的非监督聚类策略 | 第76-78页 |
3.3.5 聚类类别数的自适应选择策略 | 第78-80页 |
3.3.6 错误发音的自动标注及模型的自动更新 | 第80-81页 |
3.4 基于多维置信度的多种评测方法的融合 | 第81-83页 |
3.4.1 基本思路 | 第81页 |
3.4.2 多维置信度向量 | 第81-83页 |
3.5 实验及实验结果分析 | 第83-90页 |
3.5.1 基于音素混淆概率矩阵的方法 | 第83-85页 |
3.5.2 基于扩展发音空间的方法 | 第85-88页 |
3.5.3 基于多维置信度的方法 | 第88-89页 |
3.5.4 评测方法的实际评测性能 | 第89-90页 |
3.6 本章小结 | 第90-91页 |
第4章 汉语声调发音质量自动评测技术 | 第91-116页 |
4.1 引言 | 第91-94页 |
4.2 基频提取方法及归一化处理 | 第94-100页 |
4.2.1 基于ACF的基频提取方法 | 第94页 |
4.2.2 基于UPDUDP的基频提取方法 | 第94-96页 |
4.2.3 声调相关基频的提取 | 第96-99页 |
4.2.4 基频特征归一化 | 第99-100页 |
4.3 基于嵌入式声调模型的声调评测方法 | 第100-107页 |
4.3.1 按语音帧引入基频信息的嵌入式声调建模方法 | 第100-105页 |
4.3.2 基于嵌入式模型的声调评测方法 | 第105-107页 |
4.4 基于显式声调模型的声调评测方法 | 第107-108页 |
4.4.1 按音节引入基频信息的显式声调建模方法 | 第107-108页 |
4.4.2 基于显式模型的声调评测方法 | 第108页 |
4.5 基于多维置信度的多种评测方法的融合 | 第108-111页 |
4.6 实验及实验结果分析 | 第111-114页 |
4.6.1 基频信息对声韵母评测的影响 | 第111页 |
4.6.2 基频信息对声调评测的影响 | 第111-114页 |
4.6.3 评测方法的实际评测性能 | 第114页 |
4.7 本章小结 | 第114-116页 |
第5章 汉语儿化音发音质量自动评测技术 | 第116-136页 |
5.1 引言 | 第116-117页 |
5.2 汉语儿化音的特点 | 第117-120页 |
5.2.1 儿化音的发音规律 | 第117-118页 |
5.2.2 儿化音的声学特性 | 第118-120页 |
5.3 儿化音的建模方法 | 第120-122页 |
5.3.1 儿化音的直接拆分 | 第120-121页 |
5.3.2 儿化韵母的建模 | 第121-122页 |
5.4 基于分类思想的儿化音评测方法 | 第122-131页 |
5.4.1 基本思路 | 第122-124页 |
5.4.2 发音特征的提取 | 第124-125页 |
5.4.3 AdaBoost集成分类器及改进 | 第125-131页 |
5.5 实验及实验结果分析 | 第131-135页 |
5.5.1 不同分类器对儿化音分类的效果 | 第131-132页 |
5.5.2 不同特征组对儿化音分类的效果 | 第132-133页 |
5.5.3 评测方法的实际评测性能 | 第133-135页 |
5.6 本章小结 | 第135-136页 |
结论 | 第136-138页 |
参考文献 | 第138-151页 |
附录 | 第151-153页 |
攻读博士学位期间发表的论文及其它成果 | 第153-156页 |
致谢 | 第156-157页 |
个人简历 | 第157页 |