说话人识别中区分性问题的研究

摘要	第3-4页
Abstract	第4-5页
第1章绪论	第9-28页
1.1 说话人识别应用背景	第9-12页
1.1.1 说话人识别技术概述	第9-10页
1.1.2 说话人识别技术应用	第10-12页
1.2 说话人识别中存在的区分性问题	第12-14页
1.3 说话人区分性的研究现状	第14-22页
1.3.1 高区分性段挑选的研究现状	第15-17页
1.3.2 区分性信息干扰因素	第17-20页
1.3.3 区分性问题研究难点	第20-22页
1.4 研究工作概述	第22-27页
1.4.1 研究思路	第22-23页
1.4.2 研究框架	第23-24页
1.4.3 研究内容	第24-27页
1.5 论文组织结构	第27-28页
第2章含噪语音高区分性特征的选择	第28-47页
2.1 引论	第28页
2.2 说话人区分性挑选	第28-32页
2.2.1 VAD介绍	第28-29页
2.2.2 VAD存在的不足	第29-31页
2.2.3 高区分性语音段的筛选	第31-32页
2.3 基于SPbVAD的说话人区分性信息筛选	第32-39页
2.3.1 语音中的区分性信息	第32-33页
2.3.2 SPbVAD	第33-34页
2.3.3 实验	第34-39页
2.4 基于贝叶斯方法的特征增强	第39-45页
2.4.1 基于贝叶斯加权的打分方法	第39-42页
2.4.2 贝叶斯加权方法的性能	第42-43页
2.4.3 说话人区分性和语音区分性	第43-45页
2.5 小结	第45-47页
第3章截顶语音受损区分性信息的非线性重建	第47-74页
3.1 引论	第47-52页
3.1.1 语音截顶的概念	第47-48页
3.1.2 语音截顶现象的分析	第48-52页
3.2 截顶语音对说话人区分性的影响	第52-62页
3.2.1 人类感知评价	第53-54页
3.2.2 对语音识别的影响	第54页
3.2.3 对说话人识别的影响	第54-57页
3.2.4 对说话人模型的影响	第57-62页
3.3 截顶下高区分性语音段的筛选	第62-68页
3.3.1 截顶检测方法	第62-65页
3.3.2 截顶筛选下说话人区分性信息的变化	第65-68页
3.4 截顶语音特征信息的恢复	第68-73页
3.4.1 DNN介绍	第68-69页
3.4.2 基于DNN的截顶语音特征重建	第69-70页
3.4.3 特征区分性恢复	第70-73页
3.5 小结	第73-74页
第4章情感区分性信息的削弱	第74-94页
4.1 引言	第74-75页
4.2 情感说话人数据库CSLT-ESDB	第75-77页
4.2.1 现有的情感数据库	第75-76页
4.2.2 情感数据库的设计与录制	第76-77页
4.3 情感特征空间投影	第77-87页
4.3.1 情感对语音信号的影响	第77-79页
4.3.2 情感的区分性信息	第79-82页
4.3.3 实验	第82-87页
4.4 特征和模型对情感投影的联合优化	第87-92页
4.4.1 情感适应性训练	第87-90页
4.4.2 实验	第90-92页
4.5 小结	第92-94页
第5章总结和展望	第94-96页
5.1 论文工作总结	第94-95页
5.2 下一步研究展望	第95-96页
参考文献	第96-106页
致谢	第106-108页
个人简历、在学期间发表的学术论文与研究成果	第108-109页