首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

连续语音识别特征提取与声学模型训练区分性技术研究

摘要第4-6页
ABSTRACT第6-9页
第一章 绪论第19-39页
    1.1 研究背景及意义第19-21页
    1.2 语音识别发展概述第21-22页
    1.3 基于统计模型的语音识别系统第22-30页
        1.3.1 特征提取第23-24页
        1.3.2 声学模型第24-28页
        1.3.3 语言模型第28-29页
        1.3.4 词格译码第29-30页
    1.4 区分性技术研究现状分析第30-35页
        1.4.1 区分性特征提取研究现状分析第30-32页
        1.4.2 区分性模型第32页
        1.4.3 声学模型区分性训练研究现状分析第32-35页
    1.5 论文主要工作及组织结构第35-39页
        1.5.1 论文主要工作第35-36页
        1.5.2 论文组织结构第36-39页
第二章 区分性技术基础第39-55页
    2.1 贝叶斯风险第39-40页
    2.2 最大似然准则第40页
    2.3 传统的区分性训练准则第40-43页
        2.3.1 最大互信息准则第40-41页
        2.3.2 全面风险估计准则第41页
        2.3.3 最小音素错误准则第41-42页
        2.3.4 最小分类错误准则第42-43页
    2.4 基于边距的区分性训练准则第43-46页
        2.4.1 最大边距估计准则第43-44页
        2.4.2 软边距估计准则第44页
        2.4.3 基于强化混淆信息的区分性训练准则第44-45页
        2.4.4 采用微积分形式的区分性目标函数统一表示第45-46页
    2.5 区分性特征提取第46-52页
        2.5.1 特征空间区分性特征提取第46-50页
        2.5.2 模型空间区分性特征提取第50-52页
    2.6 实验基线系统及性能评估第52-54页
        2.6.1 实验语料库简介第52页
        2.6.2 模型单元的选择与训练第52-53页
        2.6.3 基线系统识别性能第53-54页
    2.7 本章小结第54-55页
第三章 基于线性判别分析的特征空间区分性特征提取第55-73页
    3.1 基于线性判别分析区分性特征提取的原理分析第55-56页
    3.2 基于MCE准则的语音识别特征线性判别分析第56-61页
        3.2.1 基于MCE准则特征变换的分类损失函数第56-58页
        3.2.2 基于梯度下降法的变换矩阵求解第58-60页
        3.2.3 基于MCE准则判别分析的特征参数提取第60-61页
    3.3 基于群稀疏约束的语音识别特征混合判别分析第61-65页
        3.3.1 基于二次变分形式的群稀疏线性判别分析第61-64页
        3.3.2 群稀疏的混合判别分析第64-65页
        3.3.3 基于群稀疏约束判别分析的特征参数提取第65页
    3.4 实验结果及分析第65-71页
        3.4.1 基于微软语料库语音识别结果第65-70页
        3.4.2 基于WSJ语料库的语音识别结果第70-71页
    3.5 本章小结第71-73页
第四章 基于语音分段和压缩感知的模型空间区分性特征提取第73-95页
    4.1 基于语音分段和压缩感知区分性特征提取方法的原理分析第73-74页
    4.2 基于语音分段区分性特征变换的一般形式第74-76页
        4.2.1 基于变换矩阵字典的特征变换第74-75页
        4.2.2 联合变换矩阵和偏移矢量的特征变换第75-76页
    4.3 不相关匹配追踪算法的区分性特征变换第76-80页
        4.3.1 最大似然字典项选取第77-78页
        4.3.2 相关基矢量的去除第78-79页
        4.3.3 变换矩阵权重系数的更新第79页
        4.3.4 不相关匹配追踪特征变换的算法流程第79-80页
    4.4 基于正则化的区分性特征变换第80-82页
        4.4.1 基于正则化的区分性特征变换目标函数第80-81页
        4.4.2 则化区分性特征变换的目标函数求解第81-82页
    4.5 分段区分性特征变换后的特征融合第82-84页
        4.5.1 基于特征提取网络的BN特征变换第82-83页
        4.5.2 融合区分性变换后的特征第83-84页
    4.6 基于语音分段和压缩感知的区分性特征提取方法流程第84页
    4.7 实验结果及分析第84-93页
        4.7.1 基于匹配追踪特征变换方法的识别性能第84-88页
        4.7.2 基于正则化特征变换方法的识别性能第88-91页
        4.7.3 基于帧和分段特征变换方法的抗噪声性能第91页
        4.7.4 分段区分性特征变换与融合的识别性能第91-93页
    4.8 本章小结第93-95页
第五章 广义边距区分性训练准则第95-107页
    5.1 广义边距区分性训练准则的原理分析第95-96页
    5.2 广义边距区分性训练目标准则第96-100页
        5.2.1 基于增进因子和误识个数的加权方法第97页
        5.2.2 基于后验概率的动态加权方法第97-100页
    5.3 实验结果及分析第100-105页
        5.3.1 软边距ρ和参数τ值的选取第100页
        5.3.2 基于增进因子和误识个数加权方法的识别性能第100-101页
        5.3.3 基于后验概率动态加权方法的识别性能第101-102页
        5.3.4 广义边距区分性训练准则在TIMIT和WSJ语料库的识别性能第102-104页
        5.3.5 融合动态加权前后的识别性能第104-105页
    5.4 本章小结第105-107页
第六章 声学模型区分性训练中的动态加权数据选取方法第107-119页
    6.1 基于动态加权的数据选取方法原理分析第107-108页
    6.2 区分性训练方法第108-109页
        6.2.1 最小音素错误准则统计量的计算第108页
        6.2.2 增进的最小音素错误准则第108-109页
    6.3 基于后验概率的动态加权第109-110页
        6.3.1 基于语句识别错误率的动态加权第109页
        6.3.2 基于后验概率的词图数据选取第109-110页
    6.4 基于混淆信息加权的音素准确率第110-112页
    6.5 基于动态加权的数据选取方法实现流程第112-113页
    6.6 实验结果及分析第113-117页
        6.6.1 基于后验概率的词图选取实验第113-114页
        6.6.2 基于混淆信息加权的音素准确率计算实验第114-115页
        6.6.3 基于γ_q~(zMPE)动态加权的识别实验第115-116页
        6.6.4 联合基于后验概率动态加权和混淆信息加权实验第116-117页
    6.7 本章小结第117-119页
第七章 基于混淆信息加权的区分性互补系统构造方法第119-131页
    7.1 基于混淆信息加权的互补系统构造方法原理分析第119-120页
    7.2 基于混淆信息加权的互补系统目标函数第120-122页
        7.2.1 互补最小音素错误准则第120页
        7.2.2 基于混淆信息加权的互补最小音素错误准则第120-121页
        7.2.3 互补系统融合的识别率第121-122页
    7.3 基于混淆信息加权的模型层互补系统第122-124页
        7.3.1 多最优识别结果权值的确定第122-123页
        7.3.2 互补系统音素准确率计算方法第123-124页
    7.4 基于RDLT特征变换的特征层互补系统第124-125页
    7.5 基于混淆信息加权的互补系统构造方法流程第125页
    7.6 实验结果及分析第125-129页
        7.6.1 基于微软语料库的互补系统识别性能第125-129页
        7.6.2 基于WSJ语料库的互补系统识别性能第129页
    7.7 本章小结第129-131页
第八章 总结与展望第131-135页
    一 论文总结第131-133页
    二 工作展望第133-135页
致谢第135-137页
参考文献第137-155页
作者简历第155-156页

论文共156页,点击 下载论文
上一篇:不同电极电渗过程比较及基于电导率电渗排水量计算方法
下一篇:复杂条件下地震土压力及稳定问题的计算方法研究