摘要 | 第4-6页 |
ABSTRACT | 第6-9页 |
第一章 绪论 | 第19-39页 |
1.1 研究背景及意义 | 第19-21页 |
1.2 语音识别发展概述 | 第21-22页 |
1.3 基于统计模型的语音识别系统 | 第22-30页 |
1.3.1 特征提取 | 第23-24页 |
1.3.2 声学模型 | 第24-28页 |
1.3.3 语言模型 | 第28-29页 |
1.3.4 词格译码 | 第29-30页 |
1.4 区分性技术研究现状分析 | 第30-35页 |
1.4.1 区分性特征提取研究现状分析 | 第30-32页 |
1.4.2 区分性模型 | 第32页 |
1.4.3 声学模型区分性训练研究现状分析 | 第32-35页 |
1.5 论文主要工作及组织结构 | 第35-39页 |
1.5.1 论文主要工作 | 第35-36页 |
1.5.2 论文组织结构 | 第36-39页 |
第二章 区分性技术基础 | 第39-55页 |
2.1 贝叶斯风险 | 第39-40页 |
2.2 最大似然准则 | 第40页 |
2.3 传统的区分性训练准则 | 第40-43页 |
2.3.1 最大互信息准则 | 第40-41页 |
2.3.2 全面风险估计准则 | 第41页 |
2.3.3 最小音素错误准则 | 第41-42页 |
2.3.4 最小分类错误准则 | 第42-43页 |
2.4 基于边距的区分性训练准则 | 第43-46页 |
2.4.1 最大边距估计准则 | 第43-44页 |
2.4.2 软边距估计准则 | 第44页 |
2.4.3 基于强化混淆信息的区分性训练准则 | 第44-45页 |
2.4.4 采用微积分形式的区分性目标函数统一表示 | 第45-46页 |
2.5 区分性特征提取 | 第46-52页 |
2.5.1 特征空间区分性特征提取 | 第46-50页 |
2.5.2 模型空间区分性特征提取 | 第50-52页 |
2.6 实验基线系统及性能评估 | 第52-54页 |
2.6.1 实验语料库简介 | 第52页 |
2.6.2 模型单元的选择与训练 | 第52-53页 |
2.6.3 基线系统识别性能 | 第53-54页 |
2.7 本章小结 | 第54-55页 |
第三章 基于线性判别分析的特征空间区分性特征提取 | 第55-73页 |
3.1 基于线性判别分析区分性特征提取的原理分析 | 第55-56页 |
3.2 基于MCE准则的语音识别特征线性判别分析 | 第56-61页 |
3.2.1 基于MCE准则特征变换的分类损失函数 | 第56-58页 |
3.2.2 基于梯度下降法的变换矩阵求解 | 第58-60页 |
3.2.3 基于MCE准则判别分析的特征参数提取 | 第60-61页 |
3.3 基于群稀疏约束的语音识别特征混合判别分析 | 第61-65页 |
3.3.1 基于二次变分形式的群稀疏线性判别分析 | 第61-64页 |
3.3.2 群稀疏的混合判别分析 | 第64-65页 |
3.3.3 基于群稀疏约束判别分析的特征参数提取 | 第65页 |
3.4 实验结果及分析 | 第65-71页 |
3.4.1 基于微软语料库语音识别结果 | 第65-70页 |
3.4.2 基于WSJ语料库的语音识别结果 | 第70-71页 |
3.5 本章小结 | 第71-73页 |
第四章 基于语音分段和压缩感知的模型空间区分性特征提取 | 第73-95页 |
4.1 基于语音分段和压缩感知区分性特征提取方法的原理分析 | 第73-74页 |
4.2 基于语音分段区分性特征变换的一般形式 | 第74-76页 |
4.2.1 基于变换矩阵字典的特征变换 | 第74-75页 |
4.2.2 联合变换矩阵和偏移矢量的特征变换 | 第75-76页 |
4.3 不相关匹配追踪算法的区分性特征变换 | 第76-80页 |
4.3.1 最大似然字典项选取 | 第77-78页 |
4.3.2 相关基矢量的去除 | 第78-79页 |
4.3.3 变换矩阵权重系数的更新 | 第79页 |
4.3.4 不相关匹配追踪特征变换的算法流程 | 第79-80页 |
4.4 基于正则化的区分性特征变换 | 第80-82页 |
4.4.1 基于正则化的区分性特征变换目标函数 | 第80-81页 |
4.4.2 则化区分性特征变换的目标函数求解 | 第81-82页 |
4.5 分段区分性特征变换后的特征融合 | 第82-84页 |
4.5.1 基于特征提取网络的BN特征变换 | 第82-83页 |
4.5.2 融合区分性变换后的特征 | 第83-84页 |
4.6 基于语音分段和压缩感知的区分性特征提取方法流程 | 第84页 |
4.7 实验结果及分析 | 第84-93页 |
4.7.1 基于匹配追踪特征变换方法的识别性能 | 第84-88页 |
4.7.2 基于正则化特征变换方法的识别性能 | 第88-91页 |
4.7.3 基于帧和分段特征变换方法的抗噪声性能 | 第91页 |
4.7.4 分段区分性特征变换与融合的识别性能 | 第91-93页 |
4.8 本章小结 | 第93-95页 |
第五章 广义边距区分性训练准则 | 第95-107页 |
5.1 广义边距区分性训练准则的原理分析 | 第95-96页 |
5.2 广义边距区分性训练目标准则 | 第96-100页 |
5.2.1 基于增进因子和误识个数的加权方法 | 第97页 |
5.2.2 基于后验概率的动态加权方法 | 第97-100页 |
5.3 实验结果及分析 | 第100-105页 |
5.3.1 软边距ρ和参数τ值的选取 | 第100页 |
5.3.2 基于增进因子和误识个数加权方法的识别性能 | 第100-101页 |
5.3.3 基于后验概率动态加权方法的识别性能 | 第101-102页 |
5.3.4 广义边距区分性训练准则在TIMIT和WSJ语料库的识别性能 | 第102-104页 |
5.3.5 融合动态加权前后的识别性能 | 第104-105页 |
5.4 本章小结 | 第105-107页 |
第六章 声学模型区分性训练中的动态加权数据选取方法 | 第107-119页 |
6.1 基于动态加权的数据选取方法原理分析 | 第107-108页 |
6.2 区分性训练方法 | 第108-109页 |
6.2.1 最小音素错误准则统计量的计算 | 第108页 |
6.2.2 增进的最小音素错误准则 | 第108-109页 |
6.3 基于后验概率的动态加权 | 第109-110页 |
6.3.1 基于语句识别错误率的动态加权 | 第109页 |
6.3.2 基于后验概率的词图数据选取 | 第109-110页 |
6.4 基于混淆信息加权的音素准确率 | 第110-112页 |
6.5 基于动态加权的数据选取方法实现流程 | 第112-113页 |
6.6 实验结果及分析 | 第113-117页 |
6.6.1 基于后验概率的词图选取实验 | 第113-114页 |
6.6.2 基于混淆信息加权的音素准确率计算实验 | 第114-115页 |
6.6.3 基于γ_q~(zMPE)动态加权的识别实验 | 第115-116页 |
6.6.4 联合基于后验概率动态加权和混淆信息加权实验 | 第116-117页 |
6.7 本章小结 | 第117-119页 |
第七章 基于混淆信息加权的区分性互补系统构造方法 | 第119-131页 |
7.1 基于混淆信息加权的互补系统构造方法原理分析 | 第119-120页 |
7.2 基于混淆信息加权的互补系统目标函数 | 第120-122页 |
7.2.1 互补最小音素错误准则 | 第120页 |
7.2.2 基于混淆信息加权的互补最小音素错误准则 | 第120-121页 |
7.2.3 互补系统融合的识别率 | 第121-122页 |
7.3 基于混淆信息加权的模型层互补系统 | 第122-124页 |
7.3.1 多最优识别结果权值的确定 | 第122-123页 |
7.3.2 互补系统音素准确率计算方法 | 第123-124页 |
7.4 基于RDLT特征变换的特征层互补系统 | 第124-125页 |
7.5 基于混淆信息加权的互补系统构造方法流程 | 第125页 |
7.6 实验结果及分析 | 第125-129页 |
7.6.1 基于微软语料库的互补系统识别性能 | 第125-129页 |
7.6.2 基于WSJ语料库的互补系统识别性能 | 第129页 |
7.7 本章小结 | 第129-131页 |
第八章 总结与展望 | 第131-135页 |
一 论文总结 | 第131-133页 |
二 工作展望 | 第133-135页 |
致谢 | 第135-137页 |
参考文献 | 第137-155页 |
作者简历 | 第155-156页 |