语种识别深度学习方法研究
摘要 | 第1-7页 |
ABSTRACT | 第7-9页 |
目录 | 第9-12页 |
表格索引 | 第12-13页 |
插图索引 | 第13-15页 |
算法索引 | 第15-16页 |
主要符号对照表 | 第16-18页 |
第一章 绪论 | 第18-34页 |
·语种识别简介 | 第18-24页 |
·语种识别系统框架 | 第19-20页 |
·语音中可区分语种的特征 | 第20-24页 |
·语种识别研究现状 | 第24-26页 |
·基于音素识别器的语种识别方法 | 第24-25页 |
·基于底层声学特征的语种识别方法 | 第25-26页 |
·本文的研究背景 | 第26-29页 |
·本文采用的数据集及性能评测标准 | 第29-30页 |
·测试数据集介绍 | 第29-30页 |
·性能评测标准介绍 | 第30页 |
·本文的主要内容及组织架构 | 第30-34页 |
·本文的主要内容 | 第30-31页 |
·本文的组织架构 | 第31-34页 |
第二章 语种识别方法综述 | 第34-54页 |
·基于音素识别器的语种识别方法 | 第35-40页 |
·PRLM语种识别方法 | 第36-38页 |
·PRSVM语种识别方法 | 第38-39页 |
·基于PPR的语种识别方法 | 第39页 |
·基于其它识别单元的语种识别方法 | 第39-40页 |
·基于底层声学特征的语种识别方法 | 第40-50页 |
·SDC特征 | 第41-42页 |
·GMM-UBM语种识别方法 | 第42-44页 |
·GMM-MMI语种识别方法 | 第44-45页 |
·GSV-SVM语种识别方法 | 第45-46页 |
·基于因子分析的语种识别方法 | 第46-50页 |
·基于其他特征的语种识别方法 | 第50-52页 |
·基于韵律特征的语种识别方法 | 第50-51页 |
·基于PLLR特征的语种识别方法 | 第51-52页 |
·小结 | 第52-54页 |
第三章 音素相关深瓶颈特征 | 第54-76页 |
·深度学习理论 | 第55-56页 |
·基于音素状态的特征学习 | 第56-57页 |
·带有瓶颈层的DNN训练及特征提取 | 第57-62页 |
·基于RBM模型的预训练 | 第58-61页 |
·精细调整 | 第61-62页 |
·深瓶颈特征的提取 | 第62页 |
·基于DBF语种识别系统 | 第62-63页 |
·实验 | 第63-74页 |
·DBF特征转换函数训练参数 | 第63-64页 |
·DBF与传统SDC特征的性能对比 | 第64-67页 |
·ivector流形分布 | 第67-68页 |
·DBF特征参数的优化配置 | 第68-73页 |
·PDBF-TV实验分析 | 第73-74页 |
·小结 | 第74-76页 |
第四章 融合语种信息的深瓶颈特征 | 第76-92页 |
·基于互信息的区分性训练准则 | 第77-79页 |
·互信息 | 第77-78页 |
·最大互信息准则 | 第78-79页 |
·基于MMI准则的GMM模型训练方法 | 第79-83页 |
·MMI准则下基于弱辅助函数的参数估计 | 第82-83页 |
·融合语种信息的深瓶颈特征提取器训练方法 | 第83-86页 |
·快速GMM计算方法 | 第86-88页 |
·实验 | 第88-91页 |
·模型域与特征域对比 | 第88页 |
·特征域与模型域的区分性训练结合 | 第88-90页 |
·D~2BF下的TV方法性能分析 | 第90-91页 |
·小结 | 第91-92页 |
第五章 基于深度学习的语种建模方法 | 第92-108页 |
·基于DNN的TV建模方法改进 | 第93-101页 |
·DNN后验计算下的TV建模方法 | 第94-96页 |
·基于DBF的DNN-TV系统建模方法 | 第96-97页 |
·实验 | 第97-101页 |
·基于深度学习的直接建模方法探索 | 第101-107页 |
·循环神经网络 | 第101-104页 |
·基于DNN的语种识别方法 | 第104页 |
·实验 | 第104-107页 |
·小结 | 第107-108页 |
第六章 总结 | 第108-112页 |
·本文的主要贡献 | 第108-109页 |
·后续的研究展望 | 第109-112页 |
参考文献 | 第112-122页 |
附录A GMM参数估计方法 | 第122-126页 |
附录B TV模型参数估计及ivector提取方法 | 第126-130页 |
B.1 ivector的后验概率分布 | 第127-128页 |
B.2 GMM超矢量的后验概率分布 | 第128页 |
B.3 目标函数优化 | 第128-130页 |
致谢 | 第130-134页 |
在读期间发表的学术论文与取得的研究成果 | 第134-136页 |