首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

基于深层神经网络的声学特征提取及其在LVCSR系统中的应用

摘要第1-7页
ABSTRACT第7-10页
目录第10-13页
表格第13-14页
插图第14-15页
英文缩写对照表第15-16页
第一章 绪论第16-28页
   ·语音识别发展简史第16-19页
   ·语音识别问题第19页
   ·语音识别系统构成第19-24页
     ·声学特征提取第20页
     ·声学模型第20-23页
     ·语言模型第23页
     ·解码器第23-24页
   ·本文主要内容和组织结构第24-28页
第二章 基于DNN的声学建模方法第28-40页
   ·引言第28-29页
   ·神经网络发展简史第29-31页
   ·DNN的数学表达及训练第31-38页
     ·DNN的数学表达第31-32页
     ·最小化交叉熵准则下的DNN参数估计第32-34页
     ·基于RBM-DBN的DNN参数初始化第34-38页
   ·基于DNN的语音识别声学建模第38-39页
     ·基于DNN的混合结构模型第38-39页
     ·基于DNN的声学特征提取第39页
   ·本章小结第39-40页
第三章 中文音素建模单元集的构建及Tandem特征提取第40-52页
   ·引言第40-41页
   ·建模单元集第41-44页
     ·声韵母建模单元集第41-42页
     ·主元音准则第42页
     ·BBN-UW-RWTH音素建模单元集系列第42-44页
     ·新的音素建模单元集第44页
   ·问题集的设计第44-47页
     ·扩展元音三角图第45-47页
   ·基于DNN的Tandem特征提取第47页
   ·实验及结果第47-50页
     ·数据集描述第47-48页
     ·实验配置第48页
     ·基线模型实验及分析第48-50页
     ·Tandem特征实验及分析第50页
   ·本章小结第50-52页
第四章 Bottleneck特征提取及基于非相干训练的去相关第52-68页
   ·引言第52-54页
   ·基于DNN的bottleneck特征提取第54-56页
   ·基于非相干训练算法的bottleneck特征去相关第56-59页
     ·最小化权重矩阵的相干性第56-58页
     ·最小化bottleneck层线性输出的相关系数第58-59页
   ·实验及结果第59-67页
     ·数据集描述第59-60页
     ·声学模型GMM-HMMs以及DNN-HMMs的基线系统第60-62页
     ·提取bottleneck特征的基线系统第62-65页
     ·Bottleneck DNN的非相干训练第65-67页
   ·本章小结第67-68页
第五章 DNN的序贯区分性训练及其在bottleneck特征提取中的应用第68-78页
   ·引言第68-69页
   ·DNN的序贯区分性训练第69-72页
     ·帧级交叉熵准则的简单回顾第69页
     ·序贯区分性训练准则第69-71页
     ·序贯区分性训练的平滑第71-72页
   ·实验及结果第72-76页
     ·数据集描述第72页
     ·基线模型训练第72-73页
     ·序贯区分性训练第73-75页
     ·不同结构的bottleneck DNN第75-76页
   ·本章小结第76-78页
第六章 总结第78-82页
   ·本文主要工作第78-79页
   ·进一步研究方向第79-82页
参考文献第82-94页
附录A MMIE准则下目标函数对于状态对数似然值的导数第94-98页
致谢第98-100页
研究经历及在读期间发表的学术论文第100-101页

论文共101页,点击 下载论文
上一篇:流媒体系统基于用户行为分析的资源管理研究
下一篇:语音合成音库自动标注方法研究