首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

说话人识别中通用背景模型研究及深度学习初探

致谢第4-5页
摘要第5-7页
Abstract第7-8页
1 绪论第15-25页
    1.1 研究背景及意义第15-16页
    1.2 发展历史及研究现状第16-18页
    1.3 存在的问题以及本文的解决方案第18-19页
    1.4 实验数据库第19-22页
        1.4.1 MASC语料库第19页
        1.4.2 AISHELL语料库第19页
        1.4.3 TIMIT语料库第19-22页
        1.4.4 系统性能评价标准第22页
    1.5 论文组织结构第22-25页
2 基于概率模型的说话人确认第25-47页
    2.1 概述第25页
    2.2 语音端点检测第25-26页
    2.3 特征提取第26-30页
        2.3.1 MFCC概述第26-27页
        2.3.2 MFCC提取过程第27-30页
    2.4 基于GMM-UBM的说话人确认方法第30-34页
        2.4.1 高斯混合模型介绍第30页
        2.4.2 GMM参数求解第30-31页
        2.4.3 MAP自适应第31-32页
        2.4.4 测试第32-34页
        2.4.5 系统总体框架第34页
    2.5 基于i-vector的说话人确认方法第34-43页
        2.5.1 概述第34-35页
        2.5.2 i-vector求解过程推导第35-40页
        2.5.3 全局差异矩阵训练算法第40-41页
        2.5.4 i-vector提取第41页
        2.5.5 i-vector系统后端第41-42页
        2.5.6 系统总体框架第42-43页
    2.6 实验结果与分析第43-46页
        2.6.1 系统介绍第43-44页
        2.6.2 GMM阶数对识别性能的影响第44-45页
        2.6.3 GMM-UBM系统性能对比第45页
        2.6.4 i-vector/PLDA系统性能对比第45-46页
    2.7 本章小结第46-47页
3 UBM背景说话人选择问题研究第47-59页
    3.1 引言第47页
    3.2 UBM数据冗余问题第47-49页
    3.3 以人为单位进行选择第49-51页
        3.3.1 KL距离度量说话人之间的差异程度第49-50页
        3.3.2 基于极大KLD的说话人选择方法第50-51页
    3.4 UBM支撑说话人集合第51-52页
    3.5 基于GMM超向量聚类的背景支撑说话人选择算法第52-54页
        3.5.1 说话人超向量第52-53页
        3.5.2 K均值聚类第53页
        3.5.3 具体选择算法第53-54页
    3.6 结果验证与分析第54-58页
    3.7 本章小结第58-59页
4 基于托肯配比的UBM背景语料选择第59-67页
    4.1 引言第59页
    4.2 以帧为单位进行数据选择第59-60页
    4.3 GMM托肯配比第60-61页
    4.4 具体选择算法第61-63页
    4.5 结果验证与分析第63-65页
        4.5.1 MASC实验结果第63页
        4.5.2 TIMIT实验结果第63-64页
        4.5.3 AISHELL实验结果第64页
        4.5.4 结论第64-65页
    4.6 本章小结第65-67页
5 说话人识别中深度学习方法初步探讨第67-77页
    5.1 引言第67页
    5.2 基于深度学习的说话人识别系统第67-71页
        5.2.1 音素区分性的深度神经网络(Phonetic Discriminative DNN)第67-69页
        5.2.2 说话人区分性的深度神经网络(Speaker Discriminative DNN)第69-71页
    5.3 基于梅尔语谱图和卷积神经网络的说话人鉴别系统第71-75页
        5.3.1 预处理第71-72页
        5.3.2 深度残差网络概述第72-75页
        5.3.3 基于梅尔语谱图以及卷积神经网络的说话人鉴别算法第75页
    5.4 实验结果分析第75-76页
        5.4.1 实验设置第75页
        5.4.2 实验分析第75-76页
    5.5 本章小结第76-77页
6 总结和展望第77-79页
    6.1 总结第77-78页
    6.2 展望第78-79页
参考文献第79-85页
个人简历及攻读硕士学位期间取得的研究成果第85页

论文共85页,点击 下载论文
上一篇:基于二维码导航的工业搬运机器人多路径优化方法研究
下一篇:超声造影颈动脉斑块增强强度与冠心病临床分型的相关性研究