摘要 | 第5-7页 |
Abstract | 第7-8页 |
1.绪论 | 第12-24页 |
1.1.说话人识别概述 | 第12-14页 |
1.1.1.背景及意义 | 第12-13页 |
1.1.2.说话人识别基本原理 | 第13-14页 |
1.2.说话人识别系统的研究与发展 | 第14-15页 |
1.3.说话人识别中的特征提取与分析 | 第15-16页 |
1.4.说话人识别中的识别方法 | 第16-17页 |
1.4.1.模板匹配法 | 第16页 |
1.4.2.统计概率模型法 | 第16-17页 |
1.4.3.人工神经网络 | 第17页 |
1.4.4.支持向量机法 | 第17页 |
1.5.性能评价 | 第17-18页 |
1.6.研究现状和难点 | 第18-21页 |
1.6.1.特征变换 | 第19页 |
1.6.2.鲁棒性说话人识别 | 第19-21页 |
1.7.研究工作概述与安排 | 第21-24页 |
1.7.1.工作内容 | 第21-22页 |
1.7.2.论文的组织结构 | 第22-24页 |
2.基于多步聚类变换算法的说话人辨认 | 第24-42页 |
2.1.引言 | 第24-25页 |
2.2.基于高斯混合模型的说话人辨认 | 第25-28页 |
2.2.1.说话人辨认系统 | 第25-26页 |
2.2.2.高斯混合说话人模型 | 第26-27页 |
2.2.3.前端处理 | 第27页 |
2.2.4.MFCC参数 | 第27-28页 |
2.3.基于嵌入变换的对角方差高斯混合模型 | 第28-30页 |
2.3.1.嵌入变换的对角方差高斯混合模型参数 | 第28-29页 |
2.3.2.最大似然估计的EM算法 | 第29-30页 |
2.4.基于对角方差矩阵的多步聚类EM算法 | 第30-33页 |
2.4.1.基于对角方差矩阵的聚类EM算法 | 第31-32页 |
2.4.2.多步聚类算法及其步骤 | 第32-33页 |
2.5.实验语音库 | 第33-34页 |
2.6.实验 | 第34-40页 |
2.6.1.最小描述长度(MDL)比较实验 | 第34-37页 |
2.6.2.多步聚类说话人辨认实验 | 第37-40页 |
2.7.结论 | 第40-42页 |
3.基于加权特征补偿变换的鲁棒性说话人辨认 | 第42-60页 |
3.1.引言 | 第42-43页 |
3.2.前端处理 | 第43-47页 |
3.2.1.语音检测 | 第44-45页 |
3.2.2.噪声谱估计 | 第45页 |
3.2.3.谱减 | 第45页 |
3.2.4.帧信噪比与加权因子 | 第45-47页 |
3.3.加权特征补偿变换算法 | 第47-51页 |
3.3.1.加权算法 | 第48页 |
3.3.2.对帧似然概率的归一化补偿变换 | 第48-49页 |
3.3.3.加权特征补偿变换的提出 | 第49-51页 |
3.4.鲁棒说话人识别仿真系统 | 第51-52页 |
3.4.1.预处理和特征提取 | 第51页 |
3.4.2.高斯混合模型的建立与识别 | 第51-52页 |
3.5.仿真实验与结果分析 | 第52-57页 |
3.5.1.仿真系统语音库 | 第52页 |
3.5.2.加权因子仿真实验 | 第52-54页 |
3.5.3.基于加权特征补偿变换的说话人识别方法的仿真研究 | 第54-57页 |
3.6.结论 | 第57-60页 |
4.基于自适应直方图均衡化的鲁棒性说话人辨认研究 | 第60-80页 |
4.1.引言 | 第60-62页 |
4.2.直方图均衡化 | 第62-67页 |
4.2.1.直方图均衡化原理 | 第62-65页 |
4.2.2.分位差直方图均衡化法 | 第65页 |
4.2.3.数据拟合直方图均衡化 | 第65-67页 |
4.3.改进的自适应直方图均衡化 | 第67-70页 |
4.3.1.问题的提出 | 第67-68页 |
4.3.2.自适应直方图均衡化方法 | 第68-70页 |
4.4.鲁棒说话人辨认实验的建立 | 第70页 |
4.5.实验与结果分析 | 第70-78页 |
4.5.1.变换性能实验 | 第70-75页 |
4.5.2.效率比较实验 | 第75-76页 |
4.5.3.识别性能比较实验 | 第76-78页 |
4.6.结论 | 第78-80页 |
5.总结与展望 | 第80-84页 |
5.1.论文工作总结 | 第80-81页 |
5.2.研究展望 | 第81-84页 |
致谢 | 第84-86页 |
参考文献 | 第86-96页 |
附录 | 第96-97页 |