摘要 | 第5-7页 |
Abstract | 第7-9页 |
1 绪论 | 第14-31页 |
1.1 说话人识别概述 | 第14-18页 |
1.1.1 说话人识别的研究意义与典型应用 | 第14-16页 |
1.1.2 说话人识别的发展与现状 | 第16-18页 |
1.2 说话人识别的分类 | 第18-19页 |
1.3 说话人识别系统结构 | 第19-21页 |
1.3.1 说话人识别系统结构 | 第19-20页 |
1.3.2 说话人辨认系统结构 | 第20-21页 |
1.4 说话人识别系统性能评价 | 第21-22页 |
1.4.1 说话人识别系统的性能评价 | 第21-22页 |
1.4.2 说话人辨认系统的性能评价 | 第22页 |
1.5 说话人识别的特征提取 | 第22-24页 |
1.5.1 说话人识别理想特征提取 | 第22-23页 |
1.5.2 说话人识别特征分类 | 第23-24页 |
1.6 说话人识别的主要模型 | 第24-28页 |
1.6.1 模板模型 | 第24-25页 |
1.6.2 统计模型 | 第25-27页 |
1.6.3 人工神经网络 | 第27页 |
1.6.4 支持向量机 | 第27-28页 |
1.7 本文研究工作概述 | 第28-29页 |
1.8 本文的结构安排 | 第29-31页 |
2 含噪短语音说话人识别解决方案 | 第31-44页 |
2.1 引言 | 第31页 |
2.2 噪声的类型以及噪声的影响 | 第31-32页 |
2.3 短语音说话人识别研究 | 第32-37页 |
2.4 短语音说话人识别研究面临的困难 | 第37-39页 |
2.5 含噪短语音说话人识别综合性解决方案 | 第39-43页 |
2.5.1 语音的预处理 | 第40-42页 |
2.5.2 噪声的去除 | 第42页 |
2.5.3 语音帧的分类 | 第42-43页 |
2.5.4 多种特征的提取 | 第43页 |
2.5.5 识别模型的改进 | 第43页 |
2.6 本章小结 | 第43-44页 |
3 基于多特征融合的含噪短语音说话人识别研究 | 第44-74页 |
3.1 引言 | 第44-45页 |
3.2 语音净化算法 | 第45-48页 |
3.2.1 噪声分离算法 | 第45-46页 |
3.2.2 差异检测与剔除算法 | 第46-48页 |
3.3 实验结果与分析--语音净化算法研究 | 第48-50页 |
3.3.1 实验语音库 | 第48页 |
3.3.2 语音预处理 | 第48-49页 |
3.3.3 初步噪声分离算法有效性研究 | 第49页 |
3.3.4 差异检测与剔除算法有效性研究 | 第49-50页 |
3.4 MFCC特征、ICAf特征、IMFCC特征及其组合的研究 | 第50-55页 |
3.4.1 提取MFCC特征、ICAf特征和IMFCC特征 | 第51-53页 |
3.4.2 特征组合模型训练 | 第53-54页 |
3.4.3 特征组合模型决策 | 第54-55页 |
3.5 实验结果与分析--MFCC特征、ICAf特征、IMFCC特征及其组合研究 | 第55-56页 |
3.6 提取WOCOR特征和特征组合MFCC_D_LPCC | 第56-62页 |
3.6.1 WOCOR特征 | 第57-58页 |
3.6.2 特征组合MFCC_D_LPCC | 第58-60页 |
3.6.3 实验结果与分析--单一特征参数研究 | 第60-61页 |
3.6.4 实验结果与分析--特征参数组合研究 | 第61页 |
3.6.5 WOCOR特征和特征组合MFCC_DLPCC相结合的说话人识别系统 | 第61-62页 |
3.7 特征组合中单一特征的融合系数优化 | 第62-65页 |
3.7.1 种群初始化 | 第62-63页 |
3.7.2 变异操作 | 第63-64页 |
3.7.3 交叉操作 | 第64-65页 |
3.7.4 选择操作 | 第65页 |
3.8 GMM模型和GMM-UBM模型 | 第65-66页 |
3.9 综合实验结果与分析 | 第66-72页 |
3.9.1 语音净化算法与单一特征及其组合的研究 | 第67-68页 |
3.9.2 识别模型与单一特征及其组合的研究 | 第68-71页 |
3.9.3 特征组合中单一特征的融合系数优化研究 | 第71页 |
3.9.4 测试人数对含噪短语音说话人识别率影响的研究 | 第71-72页 |
3.10 本章小结 | 第72-74页 |
4 含噪短语音噪声分离算法和语音帧质量判别算法 | 第74-87页 |
4.1 引言 | 第74页 |
4.2 基于受限NMF的噪声分离算法CNMF | 第74-76页 |
4.3 语音帧质量判别算法-ISNRDA | 第76-77页 |
4.3.1 混合语音谱特征提取 | 第76页 |
4.3.2 改进信噪比判别算法 | 第76-77页 |
4.4 语音帧质量判别算法--差异检测与判别算法(DDADA) | 第77-78页 |
4.5 基于受限NMF的信噪比判别算法(NMF-SNRDA) | 第78-79页 |
4.6 基于GMM-UBM两阶段分类模型 | 第79-80页 |
4.7 实验结果与分析 | 第80-86页 |
4.7.1 实验语音库 | 第80页 |
4.7.2 噪声分离方法对识别率的影响 | 第80-81页 |
4.7.3 语音帧质量判别算法ISNRDA对识别率的影响 | 第81页 |
4.7.4 语音帧质量判别算法DDADA对识别率的影响 | 第81-85页 |
4.7.5 语音帧质量判别算法NMF-SNRDA对识别率的影响 | 第85页 |
4.7.6 四种语音帧质量判别算法的比较 | 第85-86页 |
4.8 本章小结 | 第86-87页 |
5 双重信息质量判别算法和三阶段分类模型 | 第87-100页 |
5.1 双重信息质量判别算法 | 第87页 |
5.2 双重判别算法实验结果与分析 | 第87-88页 |
5.3 GMM-UBM三阶段分类模型 | 第88-90页 |
5.4 GMM-UBM三阶段分类模型实验结果与分析 | 第90-92页 |
5.5 局部模糊PCA降维 | 第92-94页 |
5.5.1 模糊K均值聚类算法 | 第92-93页 |
5.5.2 初始化聚类中心及其改进 | 第93-94页 |
5.5.3 PCA降维 | 第94页 |
5.6 基于模糊PCA的GMM | 第94-97页 |
5.7 判决策略 | 第97-98页 |
5.8 实验结果与分析 | 第98-99页 |
5.8.1 模糊PCA降维实验 | 第98页 |
5.8.2 不同GMM参数初始化方法对识别率的影响 | 第98-99页 |
5.9 本章小结 | 第99-100页 |
6 总结与展望 | 第100-103页 |
6.1 总结 | 第100-101页 |
6.2 研究展望 | 第101-103页 |
致谢 | 第103-104页 |
参考文献 | 第104-120页 |
附录 | 第120-121页 |