在线式开集说话人识别系统的设计与实施

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第9-15页
1.1 课题研究背景	第9-10页
1.2 说话人识别的发展历史和研究现状	第10-12页
1.3 本文的主要研究内容以及研究成果	第12-13页
1.4 论文的组织结构	第13-15页
第二章说话人识别技术概述	第15-27页
2.1 引言	第15页
2.2 说话人识别系统	第15-16页
2.3 语音特征的提取	第16-18页
2.4 GMM-UBM系统及均值超矢量技术	第18-19页
2.5 I-vector技术基本理论	第19-21页
2.5.1 基本思想	第19-20页
2.5.2 总体变化空间矩阵的估计	第20-21页
2.5.3 I-vector的估计	第21页
2.6 PLDA模型	第21-24页
2.6.1 PLDA模型训练	第22-24页
2.6.2 基于PLDA模型的得分计算	第24页
2.7 说话人识别系统的性能评价	第24-26页
2.8 本章小结	第26-27页
第三章基于I-vector的说话人识别系统及其实施	第27-41页
3.1 引言	第27页
3.2 系统框架	第27-28页
3.3 特征提取与处理	第28页
3.4 模型训练与I-vector提取	第28-29页
3.5 因子规整技术	第29-30页
3.5.1 长度规整	第29-30页
3.5.2 EFR规整	第30页
3.5.3 SN规整	第30页
3.6 I-vector中的信道补偿技术	第30-33页
3.6.1 线性鉴别分析	第31-32页
3.6.2 类内协方差归一化	第32页
3.6.3 two-covariance模型	第32-33页
3.7 得分规整技术	第33-35页
3.8 实验结果与分析	第35-40页
3.8.1 实验用的数据	第35页
3.8.2 语音长度对I-vector的影响	第35-36页
3.8.3 系统方案验证与实验	第36-38页
3.8.4 系统鲁棒性测试	第38-39页
3.8.5 得分规整对系统性能的影响	第39-40页
3.9 本章小结	第40-41页
第四章在线式开集说话人识别系统	第41-61页
4.1 前言	第41页
4.2 系统架构	第41-42页
4.3 语音分割算法	第42-44页
4.4 确认阈值的估计	第44-55页
4.4.1 阈值计算方法	第44-46页
4.4.2 常规的得分处理方法	第46-48页
4.4.3 基于多峰态分析的阈值设定方法	第48-50页
4.4.4 基于logistic回归的阈值设定方法	第50-52页
4.4.5 实验与方案论证	第52-55页
4.5 双阈值判决机制	第55-56页
4.6 在线更新算法	第56-59页
4.6.1 说话人模型更新	第56-57页
4.6.2 说话人模型提纯	第57-58页
4.6.3 阈值更新	第58页
4.6.4 实验与方案论证	第58-59页
4.7 本章小节	第59-61页
第五章系统拓展和性能评估	第61-67页
5.1 前言	第61页
5.2 与diarization系统结合的在线说话人识别系统	第61-63页
5.2.1 前端处理	第62页
5.2.2 辅助评测指标	第62-63页
5.3 实验数据与参数设置	第63-64页
5.4 实验与方案性能评测	第64-65页
5.5 整体系统评测	第65-66页
5.6 本章小结	第66-67页
第六章总结与展望	第67-69页
6.1 论文工作总结	第67-68页
6.2 研究展望	第68-69页
参考文献	第69-73页
致谢	第73-75页
攻读学位期间发表或已录用的学术论文	第75页