首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于若干声纹信息空间的说话人识别技术研究

摘要第1-8页
ABSTRACT第8-14页
第1章 绪论第14-31页
   ·说话人识别及其发展历史第14-20页
     ·背景第14-15页
     ·说话人识别技术概述第15-16页
     ·说话人识别技术的应用第16-18页
     ·说话人识别技术历史回顾第18-20页
   ·说话人确认系统基线系统(GMM-UBM)第20-24页
     ·特征提取第21-22页
     ·说话人模型建立第22-23页
     ·测试得分及得分规整第23-24页
   ·说话人确认系统的评价标准第24-25页
   ·标准数据库第25-27页
     ·NIST SRE数据库第26-27页
     ·TIMIT数据库第27页
   ·NIST SRE 2006年核心测试性能第27-29页
   ·论文研究问题以及组织结构第29-31页
第2章 基于音素空间的说话人识别技术研究第31-49页
   ·引言第31-34页
   ·最大似然线性回归第34-36页
   ·多语言编码第36-42页
     ·离散无记忆源第36-37页
     ·两阶段声纹信息提取第37-39页
     ·多语言编码声纹识别系统第39-40页
     ·得分端的融合策略第40-42页
   ·实验以及结果第42-47页
     ·多语言编码说话人识别系统的配置第42-43页
     ·结果以及分析第43-47页
   ·本章小结第47-49页
第3章 基于时域空间的说话人识别技术研究第49-61页
   ·引言第49-51页
   ·混合高斯模型-通用背景模型和联合因子分析第51-52页
   ·非监督自适应模式第52-56页
     ·模型域的非监督自适应算法第52-53页
     ·得分域的非监督自适应算法第53-56页
   ·实验以及结果第56-60页
     ·系统实验配置第56-57页
     ·结果以及分析第57-60页
   ·本章小结第60-61页
第4章 基于频域空间的说话人识别技术研究第61-76页
   ·引言第61-63页
   ·满方差矩阵的建模方法第63-66页
     ·最大后验概率估计第63-64页
     ·因子分析估计第64-66页
   ·构造超级协方差矩阵第66-67页
   ·度量准则第67-71页
     ·弗罗宾尼斯角度第67-68页
     ·对数欧拉距离度量第68-70页
     ·支持向量机第70-71页
     ·线性内积分类器第71页
   ·实验以及结果第71-75页
     ·系统实验配置第71-72页
     ·结果以及分析第72-75页
   ·本章小结第75-76页
第5章 基于深层特征空间的说话人识别技术研究第76-98页
   ·引言第76-78页
   ·深层神经网络第78-79页
   ·层叠的自动编码器第79-83页
   ·提取声纹信息的网络结构第83-89页
     ·稀疏编码限制第84-86页
     ·说话人距离限制第86-89页
   ·实验及结果第89-97页
     ·深层神经网络特征扩展系统的参数配置第90页
     ·实验以及结果第90-97页
   ·本章小结第97-98页
第6章 总结第98-101页
   ·论文的主要贡献第98-99页
   ·进一步的研究方向第99-101页
参考文献第101-107页
致谢第107-108页
在读期间发表的学术论文与取得的其他研究成果第108-109页

论文共109页,点击 下载论文
上一篇:A钢铁公司战略研究
下一篇:中国减排成本及减排政策模拟:CEEPA模型的拓展研究