首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

语种识别深度学习方法研究

摘要第1-7页
ABSTRACT第7-9页
目录第9-12页
表格索引第12-13页
插图索引第13-15页
算法索引第15-16页
主要符号对照表第16-18页
第一章 绪论第18-34页
   ·语种识别简介第18-24页
     ·语种识别系统框架第19-20页
     ·语音中可区分语种的特征第20-24页
   ·语种识别研究现状第24-26页
     ·基于音素识别器的语种识别方法第24-25页
     ·基于底层声学特征的语种识别方法第25-26页
   ·本文的研究背景第26-29页
   ·本文采用的数据集及性能评测标准第29-30页
     ·测试数据集介绍第29-30页
     ·性能评测标准介绍第30页
   ·本文的主要内容及组织架构第30-34页
     ·本文的主要内容第30-31页
     ·本文的组织架构第31-34页
第二章 语种识别方法综述第34-54页
   ·基于音素识别器的语种识别方法第35-40页
     ·PRLM语种识别方法第36-38页
     ·PRSVM语种识别方法第38-39页
     ·基于PPR的语种识别方法第39页
     ·基于其它识别单元的语种识别方法第39-40页
   ·基于底层声学特征的语种识别方法第40-50页
     ·SDC特征第41-42页
     ·GMM-UBM语种识别方法第42-44页
     ·GMM-MMI语种识别方法第44-45页
     ·GSV-SVM语种识别方法第45-46页
     ·基于因子分析的语种识别方法第46-50页
   ·基于其他特征的语种识别方法第50-52页
     ·基于韵律特征的语种识别方法第50-51页
     ·基于PLLR特征的语种识别方法第51-52页
   ·小结第52-54页
第三章 音素相关深瓶颈特征第54-76页
   ·深度学习理论第55-56页
   ·基于音素状态的特征学习第56-57页
   ·带有瓶颈层的DNN训练及特征提取第57-62页
     ·基于RBM模型的预训练第58-61页
     ·精细调整第61-62页
     ·深瓶颈特征的提取第62页
   ·基于DBF语种识别系统第62-63页
   ·实验第63-74页
     ·DBF特征转换函数训练参数第63-64页
     ·DBF与传统SDC特征的性能对比第64-67页
     ·ivector流形分布第67-68页
     ·DBF特征参数的优化配置第68-73页
     ·PDBF-TV实验分析第73-74页
   ·小结第74-76页
第四章 融合语种信息的深瓶颈特征第76-92页
   ·基于互信息的区分性训练准则第77-79页
     ·互信息第77-78页
     ·最大互信息准则第78-79页
   ·基于MMI准则的GMM模型训练方法第79-83页
     ·MMI准则下基于弱辅助函数的参数估计第82-83页
   ·融合语种信息的深瓶颈特征提取器训练方法第83-86页
   ·快速GMM计算方法第86-88页
   ·实验第88-91页
     ·模型域与特征域对比第88页
     ·特征域与模型域的区分性训练结合第88-90页
     ·D~2BF下的TV方法性能分析第90-91页
   ·小结第91-92页
第五章 基于深度学习的语种建模方法第92-108页
   ·基于DNN的TV建模方法改进第93-101页
     ·DNN后验计算下的TV建模方法第94-96页
     ·基于DBF的DNN-TV系统建模方法第96-97页
     ·实验第97-101页
   ·基于深度学习的直接建模方法探索第101-107页
     ·循环神经网络第101-104页
     ·基于DNN的语种识别方法第104页
     ·实验第104-107页
   ·小结第107-108页
第六章 总结第108-112页
   ·本文的主要贡献第108-109页
   ·后续的研究展望第109-112页
参考文献第112-122页
附录A GMM参数估计方法第122-126页
附录B TV模型参数估计及ivector提取方法第126-130页
 B.1 ivector的后验概率分布第127-128页
 B.2 GMM超矢量的后验概率分布第128页
 B.3 目标函数优化第128-130页
致谢第130-134页
在读期间发表的学术论文与取得的研究成果第134-136页

论文共136页,点击 下载论文
上一篇:无线网络瞬态与时变干扰建模与分析
下一篇:视频监控中运动对象提取与海量对象快速检索