首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于深度学习的说话人识别技术研究

摘要第4-5页
Abstract第5-6页
第一章 绪论第11-19页
    1.1 引言第11-13页
    1.2 说话人识别技术概述第13-17页
        1.2.1 说话人识别技术发展历程第13-16页
        1.2.2 说话人识别技术难点和解决方案第16-17页
    1.3 论文主要研究内容与结构安排第17-19页
第二章 说话人识别基本原理第19-37页
    2.1 说话人识别基本框架第19页
    2.2 语音预处理第19-20页
    2.3 特征参数提取第20-24页
        2.3.1 LPCC第21-22页
        2.3.2 MFCC第22-24页
    2.4 传统识别模型第24-33页
        2.4.1 GMM-UBM第24-27页
        2.4.2 GMM-SVM第27-29页
        2.4.3 TMM-UBM第29-31页
        2.4.4 i-vector第31-33页
    2.5 评价方法以及性能指标第33-36页
        2.5.1 评价方法第33-35页
        2.5.2 性能指标第35-36页
    2.6 本章小结第36-37页
第三章 基于深度特征的说话人识别技术第37-51页
    3.1 引言第37页
    3.2 深度神经网络第37-43页
        3.2.1 受限玻尔兹曼机第38-40页
        3.2.2 深度置信网络第40-43页
    3.3 深度特征提取第43-47页
        3.3.1 Bottleneck Feature第43-44页
        3.3.2 Tandem Feature第44-45页
        3.3.3 特征降维技术第45-47页
    3.4 基于Tandem Feature的文本无关实验第47-50页
        3.4.1 数据准备第47-48页
        3.4.2 DNN模型配置第48-49页
        3.4.3 实验分析第49-50页
    3.5 本章小结第50-51页
第四章 基于深度模型的说话人识别技术第51-73页
    4.1 d-vector第51-57页
        4.1.1 模型框架第51-52页
        4.1.2 实验分析第52-57页
    4.2 DNN i-vector第57-62页
        4.2.1 模型框架第57-60页
        4.2.2 结果分析第60-62页
    4.3 文本相关任务在实际应用的影响因素第62-72页
        4.3.1 噪声影响因素第63-68页
        4.3.2 跨信道影响因素第68-72页
    4.4 本章小结第72-73页
第五章 总结与展望第73-75页
参考文献第75-81页
攻读硕士期间的科研成果第81-83页
致谢第83页

论文共83页,点击 下载论文
上一篇:TFT-LCD手机显示屏残影问题的分析与解决
下一篇:类微信的非实时水下语音通信系统研究