摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
主要符号对照表 | 第16-18页 |
第一章 绪论 | 第18-28页 |
1.1 计算机辅助语言学习(CALL)简介 | 第18-19页 |
1.2 本文研究课题 | 第19-20页 |
1.3 基于语音学知识和区分性特征的错误检测算法 | 第20页 |
1.4 基于统计语音识别的错误检测算法 | 第20-25页 |
1.4.1 概述 | 第20-21页 |
1.4.2 基于后验概率计算的错误检测算法 | 第21-22页 |
1.4.3 基于假设检验模型的错误检测算法 | 第22-23页 |
1.4.4 基于有监督分类的错误检测算法 | 第23-25页 |
1.5 主要创新点及章节安排 | 第25-28页 |
第二章 基于深层神经网络的标准发音模型 | 第28-48页 |
2.1 引言 | 第28页 |
2.2 基于隐马尔可夫模型的声学模型 | 第28-33页 |
2.2.1 马尔可夫链 | 第28-30页 |
2.2.2 隐马尔可夫模型 | 第30-31页 |
2.2.3 隐马尔可夫模型在语音识别中的应用 | 第31-32页 |
2.2.4 语音特性描述的基本元素:senone | 第32-33页 |
2.3 深层神经网络(DNN)简介 | 第33-43页 |
2.3.1 基本结构 | 第33-34页 |
2.3.2 基于受限玻尔兹曼机的参数预训练算法 | 第34-38页 |
2.3.3 后向传播算法 | 第38-39页 |
2.3.4 最小交叉熵训练准则 | 第39-41页 |
2.3.5 Drop-out算法 | 第41-42页 |
2.3.6 深层神经网络在语音识别中的应用 | 第42-43页 |
2.4 用于口语发音训练的声学模型 | 第43-47页 |
2.4.1 基频曲线的嵌入 | 第44-45页 |
2.4.2 不同基频相关特征和嵌入方法的比较 | 第45-47页 |
2.5 本章小结 | 第47-48页 |
第三章 基于深层神经网络的发音质量评估方法 | 第48-64页 |
3.1 引言 | 第48页 |
3.2 基于语音识别置信度评估的方法 | 第48-50页 |
3.3 DNN框架下的发音质量评估方法 | 第50-53页 |
3.3.1 传统的GOP算法 | 第50-51页 |
3.3.2 GOP算法在DNN-HMM系统中的拓展 | 第51-52页 |
3.3.3 改进的GOP算法 | 第52-53页 |
3.4 基于KL散度正则化的DNN模型自适应技术 | 第53-56页 |
3.4.1 KL散度 | 第53-54页 |
3.4.2 基于KL散度正则化的DNN模型自适应技术 | 第54-56页 |
3.5 实验数据库和系统性能评估指标 | 第56-57页 |
3.5.1 实验数据库 | 第56-57页 |
3.5.2 系统性能评估指标 | 第57页 |
3.6 发音错误的检测和诊断结果分析 | 第57-63页 |
3.6.1 标准发音模型的训练 | 第57-58页 |
3.6.2 发音错误的检测结果分析 | 第58-60页 |
3.6.3 错误发音的诊断结果分析 | 第60-61页 |
3.6.4 DNN模型自适应对实验结果的影响 | 第61-63页 |
3.7 本章小结 | 第63-64页 |
第四章 语音学空间中基于KLD距离度量的错误检测算法 | 第64-82页 |
4.1 引言 | 第64页 |
4.2 语音学空间 | 第64-66页 |
4.2.1 语音学空间的定义 | 第64-65页 |
4.2.2 声学特征在语音学空间中的量化表示 | 第65页 |
4.2.3 基于KL散度的距离度量 | 第65-66页 |
4.3 语音学空间中基于KL散度距离度量的错误检测系统 | 第66-72页 |
4.3.1 口语发音错误检测问题的描述 | 第66-67页 |
4.3.2 基本单元的选择 | 第67页 |
4.3.3 样本中心点的近似计算方法 | 第67-68页 |
4.3.4 发音错误检测系统的基本框架 | 第68-70页 |
4.3.5 实验结果分析 | 第70-72页 |
4.4 基于语音学特征和KL散度距离度量的隐状态聚类算法 | 第72-79页 |
4.4.1 基于决策树和最大似然准则的隐状态聚类方法 | 第73-74页 |
4.4.2 基于语音学特征和KL散度度量的决策树重构 | 第74-76页 |
4.4.3 新旧声学模型的比较 | 第76-77页 |
4.4.4 语音识别结果分析 | 第77-79页 |
4.4.5 发音错误检测结果分析 | 第79页 |
4.5 本章小结 | 第79-82页 |
第五章 基于多任务学习的错误检测算法 | 第82-96页 |
5.1 引言 | 第82页 |
5.2 多任务学习 | 第82-84页 |
5.2.1 多任务学习基本原理 | 第82-83页 |
5.2.2 多任务学习在不同领域的应用 | 第83-84页 |
5.3 逻辑回归模型 | 第84-85页 |
5.3.1 二项逻辑回归模型 | 第84页 |
5.3.2 基于最大似然准则的模型参数估计 | 第84-85页 |
5.4 基于神经网络的多任务分类器 | 第85-88页 |
5.4.1 输入特征 | 第85-86页 |
5.4.2 分类器设计 | 第86-88页 |
5.5 实验结果 | 第88-92页 |
5.5.1 英文学习的发音错误检测结果分析 | 第88-91页 |
5.5.2 中文学习的发音错误检测结果分析 | 第91-92页 |
5.6 本章小结 | 第92-96页 |
第六章 在线系统的实现与应用 | 第96-102页 |
6.1 引言 | 第96页 |
6.2 模型的压缩与加速 | 第96-100页 |
6.2.1 基于奇异值分解的模型压缩算法 | 第96-97页 |
6.2.2 基于帧异步的解码算法 | 第97-98页 |
6.2.3 实验结果 | 第98-100页 |
6.3 相关应用 | 第100页 |
6.4 本章小结 | 第100-102页 |
第七章 总结与展望 | 第102-106页 |
7.1 本文的主要工作 | 第102-103页 |
7.2 研究工作展望 | 第103-106页 |
参考文献 | 第106-116页 |
致谢 | 第116-118页 |
在读期间发表的学术论文与取得的研究成果 | 第118页 |