首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

基于I-VECTOR的与文本无关的说话人识别研究

摘要第8-9页
Abstract第9-10页
第1章 绪论第13-20页
    1.1 说话人识别概述第13-14页
    1.2 说话人识别发展历史和研究现状第14-16页
    1.3 说话人识别基本原理和系统结构第16-17页
        1.3.1 特征提取第16-17页
        1.3.2 模式匹配第17页
    1.4 说话人识别系统性能评估第17-18页
    1.5 论文主要工作和论文的结构安排第18-20页
第2章 语音信号的分析和预处理第20-26页
    2.1 语音信号的产生第20页
    2.2 语音信号的数字模型第20-22页
        2.2.1 激励模型第20-21页
        2.2.2 声道模型第21页
        2.2.3 辐射模型第21-22页
    2.3 语音信号的预处理第22-25页
        2.3.1 采样与量化第22页
        2.3.2 预加重第22-23页
        2.3.3 分帧与加窗第23-24页
        2.3.4 端点检测第24-25页
    2.4 本章小结第25-26页
第3章 说话人识别的特征提取第26-35页
    3.1 基音周期第26-28页
    3.2 线性预测倒谱系数第28-29页
    3.3 美尔频率倒谱系数第29-32页
    3.4 特征参数的优化第32-33页
        3.4.1 短时能量归一化第32页
        3.4.2 高阶差分参数第32-33页
        3.4.3 倒谱均值减(CMS)第33页
        3.4.4 特征弯折第33页
    3.5 本章小结第33-35页
第4章 基于GMM-UBM的说话人确认第35-45页
    4.1 高斯混合模型(GMM)第35-37页
        4.1.1 GMM的概念和模型第35-36页
        4.1.2 GMM的参数估计第36-37页
    4.2 高斯混合通用背景模型(GMM-UBM)第37-40页
        4.2.1 GMM-UBM的概括第37-38页
        4.2.2 最大后验准则算法第38-40页
    4.3 实验与分析第40-44页
        4.3.1 不同特征对GMM-UBM的影响第40-41页
        4.3.2 混合度对GMM-UBM系统的影响第41-42页
        4.3.3 说话人识别界面第42-44页
    4.4 本章小结第44-45页
第5章 基于i-vector的说话人确认第45-63页
    5.1 身份认证矢量第45-54页
        5.1.1 均值超矢量第46页
        5.1.2 全变量空间矩阵第46-48页
        5.1.3 i-vector的规整第48页
        5.1.4 信道补偿第48-50页
        5.1.5 余弦评分第50页
        5.1.6 实验与分析第50-54页
    5.2 概率线性鉴别性分析第54-57页
        5.2.1 PLDA模型第54-55页
        5.2.2 模型训练第55-56页
        5.2.3 GPLDA得分计算第56-57页
    5.3 改进的GPLDA模型第57-60页
        5.3.1 全变量空间矩阵T列向量归一化第57-58页
        5.3.2 T矩阵列向量归一化后对系统的影响第58-60页
    5.4 实验与分析第60-62页
        5.4.1 实验数据和参数第60页
        5.4.2 改进的GPLDA的系统性能第60-62页
    5.5 本章小结第62-63页
总结与展望第63-65页
参考文献第65-70页
致谢第70-71页
附录A 攻读学位期间所发表的学术论文目录第71页

论文共71页,点击 下载论文
上一篇:基于双目视觉的结构试件位移角点检测方法研究
下一篇:海天背景红外成像探测系统作用距离预测研究