摘要 | 第5-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第15-23页 |
1.1 研究背景 | 第15-16页 |
1.2 国内外研究现状 | 第16-18页 |
1.2.1 说话人分割方法 | 第16-17页 |
1.2.2 说话人聚类方法 | 第17-18页 |
1.3 存在的问题 | 第18-19页 |
1.4 实验数据库 | 第19页 |
1.5 系统性能的评价标准 | 第19-20页 |
1.6 论文研究内容与安排 | 第20-23页 |
第2章 典型的说话人分割聚类系统及改进 | 第23-45页 |
2.1 引言 | 第23页 |
2.2 说话人分割聚类系统框架 | 第23-27页 |
2.2.1 有效语音检测 | 第23-24页 |
2.2.2 说话人变化点检测 | 第24-26页 |
2.2.3 说话人聚类 | 第26-27页 |
2.2.4 重分割 | 第27页 |
2.3 相似度度量 | 第27-32页 |
2.3.1 归一化交叉似然比(NCLR) | 第27-28页 |
2.3.2 T-Test度量距离 | 第28-29页 |
2.3.3 i-vector/PLDA对数似然比得分 | 第29-31页 |
2.3.4 实验 | 第31-32页 |
2.4 基于深度学习的变化点检测 | 第32-40页 |
2.4.1 深度学习介绍 | 第32-37页 |
2.4.2 DNN变化点检测 | 第37-39页 |
2.4.3 实验 | 第39-40页 |
2.5 多系统融合研究 | 第40-42页 |
2.6 小结 | 第42-45页 |
第3章 基于深度学习的特征降噪 | 第45-55页 |
3.1 引言 | 第45页 |
3.2 DNN降噪特征 | 第45-49页 |
3.2.1 回归的原理 | 第46-47页 |
3.2.2 回归DNN降噪 | 第47-49页 |
3.3 实验结果与分析 | 第49-53页 |
3.4 小结 | 第53-55页 |
第4章 聚类中话者模型产生算法 | 第55-65页 |
4.1 引言 | 第55页 |
4.2 说话人类别模型GMM | 第55-59页 |
4.2.1 UBM模型训练 | 第55-58页 |
4.2.2 MAP过程 | 第58-59页 |
4.3 长度规整的MAP建模 | 第59-61页 |
4.4 实验 | 第61-63页 |
4.5 小结 | 第63-65页 |
第5章 人数确定的方法 | 第65-75页 |
5.1 引言 | 第65页 |
5.2 T_s准则 | 第65-68页 |
5.2.1 T_s准则确定人数方法 | 第65-67页 |
5.2.2 实验 | 第67-68页 |
5.3 融合本句类内类间距离 | 第68-70页 |
5.3.1 融合本句类内类间距离原理 | 第68-70页 |
5.3.2 实验 | 第70页 |
5.4 T-Test度量距离的改进 | 第70-73页 |
5.4.1 T-Test度量距离的改进原理 | 第70-71页 |
5.4.2 实验结果 | 第71-73页 |
5.5 小结 | 第73-75页 |
第6章 总结与展望 | 第75-77页 |
6.1 本论文工作总结 | 第75-76页 |
6.2 进一步研究工作 | 第76-77页 |
参考文献 | 第77-81页 |
附录A 论文规范 | 第81-83页 |
致谢 | 第83-85页 |
在读期间发表的学术论文与取得的研究成果 | 第85页 |