说话人识别中区分性问题的研究
摘要 | 第3-4页 |
Abstract | 第4-5页 |
第1章 绪论 | 第9-28页 |
1.1 说话人识别应用背景 | 第9-12页 |
1.1.1 说话人识别技术概述 | 第9-10页 |
1.1.2 说话人识别技术应用 | 第10-12页 |
1.2 说话人识别中存在的区分性问题 | 第12-14页 |
1.3 说话人区分性的研究现状 | 第14-22页 |
1.3.1 高区分性段挑选的研究现状 | 第15-17页 |
1.3.2 区分性信息干扰因素 | 第17-20页 |
1.3.3 区分性问题研究难点 | 第20-22页 |
1.4 研究工作概述 | 第22-27页 |
1.4.1 研究思路 | 第22-23页 |
1.4.2 研究框架 | 第23-24页 |
1.4.3 研究内容 | 第24-27页 |
1.5 论文组织结构 | 第27-28页 |
第2章 含噪语音高区分性特征的选择 | 第28-47页 |
2.1 引论 | 第28页 |
2.2 说话人区分性挑选 | 第28-32页 |
2.2.1 VAD介绍 | 第28-29页 |
2.2.2 VAD存在的不足 | 第29-31页 |
2.2.3 高区分性语音段的筛选 | 第31-32页 |
2.3 基于SPbVAD的说话人区分性信息筛选 | 第32-39页 |
2.3.1 语音中的区分性信息 | 第32-33页 |
2.3.2 SPbVAD | 第33-34页 |
2.3.3 实验 | 第34-39页 |
2.4 基于贝叶斯方法的特征增强 | 第39-45页 |
2.4.1 基于贝叶斯加权的打分方法 | 第39-42页 |
2.4.2 贝叶斯加权方法的性能 | 第42-43页 |
2.4.3 说话人区分性和语音区分性 | 第43-45页 |
2.5 小结 | 第45-47页 |
第3章 截顶语音受损区分性信息的非线性重建 | 第47-74页 |
3.1 引论 | 第47-52页 |
3.1.1 语音截顶的概念 | 第47-48页 |
3.1.2 语音截顶现象的分析 | 第48-52页 |
3.2 截顶语音对说话人区分性的影响 | 第52-62页 |
3.2.1 人类感知评价 | 第53-54页 |
3.2.2 对语音识别的影响 | 第54页 |
3.2.3 对说话人识别的影响 | 第54-57页 |
3.2.4 对说话人模型的影响 | 第57-62页 |
3.3 截顶下高区分性语音段的筛选 | 第62-68页 |
3.3.1 截顶检测方法 | 第62-65页 |
3.3.2 截顶筛选下说话人区分性信息的变化 | 第65-68页 |
3.4 截顶语音特征信息的恢复 | 第68-73页 |
3.4.1 DNN介绍 | 第68-69页 |
3.4.2 基于DNN的截顶语音特征重建 | 第69-70页 |
3.4.3 特征区分性恢复 | 第70-73页 |
3.5 小结 | 第73-74页 |
第4章 情感区分性信息的削弱 | 第74-94页 |
4.1 引言 | 第74-75页 |
4.2 情感说话人数据库CSLT-ESDB | 第75-77页 |
4.2.1 现有的情感数据库 | 第75-76页 |
4.2.2 情感数据库的设计与录制 | 第76-77页 |
4.3 情感特征空间投影 | 第77-87页 |
4.3.1 情感对语音信号的影响 | 第77-79页 |
4.3.2 情感的区分性信息 | 第79-82页 |
4.3.3 实验 | 第82-87页 |
4.4 特征和模型对情感投影的联合优化 | 第87-92页 |
4.4.1 情感适应性训练 | 第87-90页 |
4.4.2 实验 | 第90-92页 |
4.5 小结 | 第92-94页 |
第5章 总结和展望 | 第94-96页 |
5.1 论文工作总结 | 第94-95页 |
5.2 下一步研究展望 | 第95-96页 |
参考文献 | 第96-106页 |
致谢 | 第106-108页 |
个人简历、在学期间发表的学术论文与研究成果 | 第108-109页 |