首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

在线式开集说话人识别系统的设计与实施

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-15页
    1.1 课题研究背景第9-10页
    1.2 说话人识别的发展历史和研究现状第10-12页
    1.3 本文的主要研究内容以及研究成果第12-13页
    1.4 论文的组织结构第13-15页
第二章 说话人识别技术概述第15-27页
    2.1 引言第15页
    2.2 说话人识别系统第15-16页
    2.3 语音特征的提取第16-18页
    2.4 GMM-UBM系统及均值超矢量技术第18-19页
    2.5 I-vector技术基本理论第19-21页
        2.5.1 基本思想第19-20页
        2.5.2 总体变化空间矩阵的估计第20-21页
        2.5.3 I-vector的估计第21页
    2.6 PLDA模型第21-24页
        2.6.1 PLDA模型训练第22-24页
        2.6.2 基于PLDA模型的得分计算第24页
    2.7 说话人识别系统的性能评价第24-26页
    2.8 本章小结第26-27页
第三章 基于I-vector的说话人识别系统及其实施第27-41页
    3.1 引言第27页
    3.2 系统框架第27-28页
    3.3 特征提取与处理第28页
    3.4 模型训练与I-vector提取第28-29页
    3.5 因子规整技术第29-30页
        3.5.1 长度规整第29-30页
        3.5.2 EFR规整第30页
        3.5.3 SN规整第30页
    3.6 I-vector中的信道补偿技术第30-33页
        3.6.1 线性鉴别分析第31-32页
        3.6.2 类内协方差归一化第32页
        3.6.3 two-covariance模型第32-33页
    3.7 得分规整技术第33-35页
    3.8 实验结果与分析第35-40页
        3.8.1 实验用的数据第35页
        3.8.2 语音长度对I-vector的影响第35-36页
        3.8.3 系统方案验证与实验第36-38页
        3.8.4 系统鲁棒性测试第38-39页
        3.8.5 得分规整对系统性能的影响第39-40页
    3.9 本章小结第40-41页
第四章 在线式开集说话人识别系统第41-61页
    4.1 前言第41页
    4.2 系统架构第41-42页
    4.3 语音分割算法第42-44页
    4.4 确认阈值的估计第44-55页
        4.4.1 阈值计算方法第44-46页
        4.4.2 常规的得分处理方法第46-48页
        4.4.3 基于多峰态分析的阈值设定方法第48-50页
        4.4.4 基于logistic回归的阈值设定方法第50-52页
        4.4.5 实验与方案论证第52-55页
    4.5 双阈值判决机制第55-56页
    4.6 在线更新算法第56-59页
        4.6.1 说话人模型更新第56-57页
        4.6.2 说话人模型提纯第57-58页
        4.6.3 阈值更新第58页
        4.6.4 实验与方案论证第58-59页
    4.7 本章小节第59-61页
第五章 系统拓展和性能评估第61-67页
    5.1 前言第61页
    5.2 与diarization系统结合的在线说话人识别系统第61-63页
        5.2.1 前端处理第62页
        5.2.2 辅助评测指标第62-63页
    5.3 实验数据与参数设置第63-64页
    5.4 实验与方案性能评测第64-65页
    5.5 整体系统评测第65-66页
    5.6 本章小结第66-67页
第六章 总结与展望第67-69页
    6.1 论文工作总结第67-68页
    6.2 研究展望第68-69页
参考文献第69-73页
致谢第73-75页
攻读学位期间发表或已录用的学术论文第75页

论文共75页,点击 下载论文
上一篇:基于噪声补偿的光矢量信号再生研究
下一篇:音频场景检测机制的设计与实施