首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

文本无关的说话人识别研究

摘要第3-4页
ABSTRACT第4-5页
1 绪论第9-15页
    1.1 研究背景与意义第9-10页
    1.2 研究起源与现状第10-11页
    1.3 说话人识别概述第11-13页
        1.3.1 说话人识别分类第11页
        1.3.2 说话人识别基本原理第11-12页
        1.3.3 系统评价指标第12-13页
    1.4 本文主要工作第13-14页
    1.5 本章小结第14-15页
2 语音特征分析与提取第15-25页
    2.1 语音信号基本理论第15-16页
        2.1.1 语音信号的产生机理第15页
        2.1.2 语音信号的物理模型第15-16页
    2.2 预处理第16-17页
        2.2.1 采样和量化第16页
        2.2.2 预加重第16页
        2.2.3 加窗第16-17页
    2.3 语音信号特征分析第17-19页
        2.3.1 时域分析第17-19页
        2.3.2 频域分析第19页
    2.4 语音信号特征提取第19-24页
        2.4.1 线性预测倒谱系数(LPCC)第20-22页
        2.4.2 Mel频率倒谱系数(MFCC)第22-24页
        2.4.3 感知线性预测分析(PLP)第24页
    2.5 本章小结第24-25页
3 基于常向量方法的说话人识别第25-53页
    3.1 常向量方法研究第25-28页
        3.1.1 常向量方法基本理论第25-26页
        3.1.2 常向量方法的有效性第26-28页
    3.2 GMM-UBM模型研究第28-34页
        3.2.1 通用背景模型(UBM)第29-32页
        3.2.2 自适应目标说话人模型第32-34页
        3.2.3 对数似然比计算第34页
    3.3 GMM-SVM模型研究第34-43页
        3.3.1 支持向量机概述第35-40页
        3.3.2 GMM-UBM与SVM的融合第40-43页
    3.4 全变量因子分析模型研究第43-52页
        3.4.1 因子分析基本思想第43-44页
        3.4.2 联合因子分析第44-47页
        3.4.3 全变量因子分析第47-50页
        3.4.4 i-vector的规整第50页
        3.4.5 信道补偿技术第50-52页
    3.5 本章小结第52-53页
4 基于深度学习的说话人识别第53-59页
    4.1 深度学习概述第53页
    4.2 受限玻尔兹曼机第53-55页
    4.3 对比散度学习算法第55页
    4.4 高斯可视单元第55-56页
    4.5 RBM在说话人识别中的应用第56-58页
    4.6 本章小结第58-59页
5 系统实验与结果分析第59-67页
    5.1 实验条件第59页
        5.1.1 软硬件环境第59页
        5.1.2 语料库第59页
        5.1.3 实验基本设置第59页
    5.2 基于常向量方法的说话人确认实验第59-61页
    5.3 基于深度学习的说话人确认实验第61-63页
    5.4 改进的GMM-SVM融合实验第63-64页
    5.5 全变量因子分析实验第64-66页
    5.6 本章小结第66-67页
6 总结与展望第67-69页
    6.1 工作总结第67-68页
    6.2 研究展望第68-69页
致谢第69-71页
参考文献第71-75页
附录第75页
    A. 作者在攻读硕士学位期间发表的论文目录第75页

论文共75页,点击 下载论文
上一篇:灸法结合中药周期内服治疗痰湿阻滞型多囊卵巢综合征的疗效观察
下一篇:黄20井区开发效果评价及综合调整部署