首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

基于深层神经网络的口语发音检测与错误分析

摘要第5-7页
ABSTRACT第7-8页
主要符号对照表第16-18页
第一章 绪论第18-28页
    1.1 计算机辅助语言学习(CALL)简介第18-19页
    1.2 本文研究课题第19-20页
    1.3 基于语音学知识和区分性特征的错误检测算法第20页
    1.4 基于统计语音识别的错误检测算法第20-25页
        1.4.1 概述第20-21页
        1.4.2 基于后验概率计算的错误检测算法第21-22页
        1.4.3 基于假设检验模型的错误检测算法第22-23页
        1.4.4 基于有监督分类的错误检测算法第23-25页
    1.5 主要创新点及章节安排第25-28页
第二章 基于深层神经网络的标准发音模型第28-48页
    2.1 引言第28页
    2.2 基于隐马尔可夫模型的声学模型第28-33页
        2.2.1 马尔可夫链第28-30页
        2.2.2 隐马尔可夫模型第30-31页
        2.2.3 隐马尔可夫模型在语音识别中的应用第31-32页
        2.2.4 语音特性描述的基本元素:senone第32-33页
    2.3 深层神经网络(DNN)简介第33-43页
        2.3.1 基本结构第33-34页
        2.3.2 基于受限玻尔兹曼机的参数预训练算法第34-38页
        2.3.3 后向传播算法第38-39页
        2.3.4 最小交叉熵训练准则第39-41页
        2.3.5 Drop-out算法第41-42页
        2.3.6 深层神经网络在语音识别中的应用第42-43页
    2.4 用于口语发音训练的声学模型第43-47页
        2.4.1 基频曲线的嵌入第44-45页
        2.4.2 不同基频相关特征和嵌入方法的比较第45-47页
    2.5 本章小结第47-48页
第三章 基于深层神经网络的发音质量评估方法第48-64页
    3.1 引言第48页
    3.2 基于语音识别置信度评估的方法第48-50页
    3.3 DNN框架下的发音质量评估方法第50-53页
        3.3.1 传统的GOP算法第50-51页
        3.3.2 GOP算法在DNN-HMM系统中的拓展第51-52页
        3.3.3 改进的GOP算法第52-53页
    3.4 基于KL散度正则化的DNN模型自适应技术第53-56页
        3.4.1 KL散度第53-54页
        3.4.2 基于KL散度正则化的DNN模型自适应技术第54-56页
    3.5 实验数据库和系统性能评估指标第56-57页
        3.5.1 实验数据库第56-57页
        3.5.2 系统性能评估指标第57页
    3.6 发音错误的检测和诊断结果分析第57-63页
        3.6.1 标准发音模型的训练第57-58页
        3.6.2 发音错误的检测结果分析第58-60页
        3.6.3 错误发音的诊断结果分析第60-61页
        3.6.4 DNN模型自适应对实验结果的影响第61-63页
    3.7 本章小结第63-64页
第四章 语音学空间中基于KLD距离度量的错误检测算法第64-82页
    4.1 引言第64页
    4.2 语音学空间第64-66页
        4.2.1 语音学空间的定义第64-65页
        4.2.2 声学特征在语音学空间中的量化表示第65页
        4.2.3 基于KL散度的距离度量第65-66页
    4.3 语音学空间中基于KL散度距离度量的错误检测系统第66-72页
        4.3.1 口语发音错误检测问题的描述第66-67页
        4.3.2 基本单元的选择第67页
        4.3.3 样本中心点的近似计算方法第67-68页
        4.3.4 发音错误检测系统的基本框架第68-70页
        4.3.5 实验结果分析第70-72页
    4.4 基于语音学特征和KL散度距离度量的隐状态聚类算法第72-79页
        4.4.1 基于决策树和最大似然准则的隐状态聚类方法第73-74页
        4.4.2 基于语音学特征和KL散度度量的决策树重构第74-76页
        4.4.3 新旧声学模型的比较第76-77页
        4.4.4 语音识别结果分析第77-79页
        4.4.5 发音错误检测结果分析第79页
    4.5 本章小结第79-82页
第五章 基于多任务学习的错误检测算法第82-96页
    5.1 引言第82页
    5.2 多任务学习第82-84页
        5.2.1 多任务学习基本原理第82-83页
        5.2.2 多任务学习在不同领域的应用第83-84页
    5.3 逻辑回归模型第84-85页
        5.3.1 二项逻辑回归模型第84页
        5.3.2 基于最大似然准则的模型参数估计第84-85页
    5.4 基于神经网络的多任务分类器第85-88页
        5.4.1 输入特征第85-86页
        5.4.2 分类器设计第86-88页
    5.5 实验结果第88-92页
        5.5.1 英文学习的发音错误检测结果分析第88-91页
        5.5.2 中文学习的发音错误检测结果分析第91-92页
    5.6 本章小结第92-96页
第六章 在线系统的实现与应用第96-102页
    6.1 引言第96页
    6.2 模型的压缩与加速第96-100页
        6.2.1 基于奇异值分解的模型压缩算法第96-97页
        6.2.2 基于帧异步的解码算法第97-98页
        6.2.3 实验结果第98-100页
    6.3 相关应用第100页
    6.4 本章小结第100-102页
第七章 总结与展望第102-106页
    7.1 本文的主要工作第102-103页
    7.2 研究工作展望第103-106页
参考文献第106-116页
致谢第116-118页
在读期间发表的学术论文与取得的研究成果第118页

论文共118页,点击 下载论文
上一篇:无理由退货与质量要求对卖家销售决策影响机制研究
下一篇:基于政策过程理论的广州“禁电”政策变迁研究