摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-19页 |
1.1 说话人辨认的基本概念 | 第9-10页 |
1.2 说话人辨认技术的研究与发展 | 第10-12页 |
1.3 说话人语音特征 | 第12-13页 |
1.4 说话人识别方法 | 第13-16页 |
1.4.1 非参数模型方法 | 第13-14页 |
1.4.2 参数模型方法 | 第14-15页 |
1.4.3 神经网络方法 | 第15-16页 |
1.5 说话人识别应用前景 | 第16-17页 |
1.6 本课题主要研究内容 | 第17-19页 |
第2章 说话人语音特征提取方法 | 第19-35页 |
2.1 说话人识别系统的前端处理 | 第20-22页 |
2.2 线性预测倒谱系数LPCC的提取方法 | 第22-24页 |
2.3 美尔频率倒谱系数MFCC的提取方法 | 第24-28页 |
2.4 感知线性预测系数PLPC的提取方法 | 第28-29页 |
2.5 子带能量倒谱参数SUBNC的提取方法 | 第29-33页 |
2.5.1 Teager能量算子 | 第29-30页 |
2.5.2 子带能量特征参数 | 第30-31页 |
2.5.3 子带加权方法 | 第31-33页 |
2.6 其它语音特征 | 第33页 |
2.7 本章小结 | 第33-35页 |
第3章 说话人辨认方法 | 第35-52页 |
3.1 高斯混合模型 | 第36-44页 |
3.1.1 模型描述 | 第37-38页 |
3.1.2 模型说明 | 第38-39页 |
3.1.3 最大似然参数估计 | 第39-42页 |
3.1.4 说话人辨认方法 | 第42-43页 |
3.1.5 其它参数估计方法 | 第43-44页 |
3.2 基于模糊C-均值的VQ模型 | 第44-49页 |
3.2.1 基于VQ的说话人辨认系统 | 第44页 |
3.2.2 模糊C-均值聚类法 | 第44-49页 |
3.2.3 基于模糊C-均值的VQ说话人辨认方法 | 第49页 |
3.3 自组织映射网络模型 | 第49-51页 |
3.4 本章小结 | 第51-52页 |
第4章 概率神经网络说话人辨认方法 | 第52-79页 |
4.1 PNN模型描述 | 第52-53页 |
4.2 PNN的最大似然训练方法 | 第53-56页 |
4.3 PNN的最小分类错误训练方法 | 第56-58页 |
4.4 基于异方差PNN模型的训练方法 | 第58-62页 |
4.4.1 异方差PNN模型 | 第58-59页 |
4.4.2 异方差PNN训练方法 | 第59-62页 |
4.5 基于遗传聚类PNN的训练方法 | 第62-64页 |
4.6 基于并行PNN的训练方法 | 第64-65页 |
4.7 基于噪声自适应的PNN训练方法 | 第65-72页 |
4.8 PNN模型及其训练方法 | 第72-78页 |
4.8.1 SPNN模型 | 第72-73页 |
4.8.2 PNN模型及其EM训练算法 | 第73-78页 |
4.9 本章小结 | 第78-79页 |
第5章 仿真结果与分析 | 第79-90页 |
5.1 语音特征参数性能实验 | 第80-81页 |
5.2 说话人辨认方法性能实验 | 第81-82页 |
5.2.1 基于模糊C-均值的VQ说话人辨认结果 | 第81页 |
5.2.2 基于SOM的说话人辨认结果 | 第81-82页 |
5.3 基于PNN的说话人辨认方法性能实验 | 第82-89页 |
5.3.1 PNN的MCE训练方法实验结果 | 第82页 |
5.3.2 PNN异方差模型的训练方法实验结果 | 第82-84页 |
5.3.3 PNN的遗传聚类训练方法实验结果 | 第84页 |
5.3.4 PNN并行模型的训练方法实验结果 | 第84-85页 |
5.3.5 PNN噪声自适应模型的训练方法实验结果 | 第85-87页 |
5.3.6 PNN模型的训练方法实验结果 | 第87-89页 |
5.4 本章小结 | 第89-90页 |
结论 | 第90-92页 |
参考文献 | 第92-99页 |
攻读硕士学位期间承担的科研任务与主要成果 | 第99-100页 |
致谢 | 第100-101页 |
作者简介 | 第101页 |