改进的核函数算法及其在说话人辨认中的应用研究
致谢 | 第1-6页 |
中文摘要 | 第6-7页 |
ABSTRACT | 第7-10页 |
图 | 第10-11页 |
表 | 第11-12页 |
1 引言 | 第12-18页 |
·研究背景及意义 | 第12-13页 |
·说话人识别国内外研究现状 | 第13-16页 |
·技术研究现状 | 第13-14页 |
·应用研究现状 | 第14-15页 |
·说话人识别技术的难点 | 第15-16页 |
·本课题的主要工作 | 第16-17页 |
·本论文的内容安排 | 第17-18页 |
2 说话人识别技术 | 第18-33页 |
·说话人识别的基本原理 | 第18-21页 |
·基本概念 | 第18-19页 |
·说话人识别的分类 | 第19-20页 |
·系统的性能评价 | 第20-21页 |
·特征提取技术 | 第21-23页 |
·线性预测系数(LPC) | 第21-22页 |
·LPC倒谱系数(LPCC) | 第22-23页 |
·Mel倒谱系数(MFCC) | 第23页 |
·说话人识别模型 | 第23-32页 |
·动态时间规整(DTW)方法 | 第23-24页 |
·矢量量化(VQ)方法 | 第24页 |
·隐马尔可夫模型(HMM)方法 | 第24-25页 |
·高斯混合模型(GMM)方法 | 第25-26页 |
·人工神经(ANN)网络方法 | 第26页 |
·支持向量机 | 第26-32页 |
·本章小节 | 第32-33页 |
3 基于改进核函数的说话人辨认系统 | 第33-54页 |
·特征提取 | 第34-46页 |
·预处理 | 第34-36页 |
·MFCC系数提取 | 第36-37页 |
·主成分分析法(PCA) | 第37-38页 |
·GMM超向量 | 第38-46页 |
·通用背景模型(UBM) | 第39-42页 |
·MAP自适应 | 第42-45页 |
·超向量的生成 | 第45-46页 |
·核函数的选择 | 第46-51页 |
·KL散度核函数 | 第47-48页 |
·L~2函数空间内积核函数 | 第48-49页 |
·基于NAP映射的核函数 | 第49-51页 |
·多类分类支持向量机 | 第51-53页 |
·一对多方法 | 第52页 |
·一对一方法 | 第52-53页 |
·有向无环图 | 第53页 |
·本章小节 | 第53-54页 |
4 实验及分析 | 第54-62页 |
·仿真实验环境 | 第54页 |
·硬件及软件条件 | 第54页 |
·语音库的建立 | 第54页 |
·训练及识别 | 第54-56页 |
·特征参数性能实验 | 第56-58页 |
·核函数性能实验 | 第58-60页 |
·使用干净语音的测试结果 | 第58-59页 |
·系统对噪声的鲁棒性的测试 | 第59-60页 |
·结果分析 | 第60-61页 |
·本章小节 | 第61-62页 |
5 结论 | 第62-64页 |
参考文献 | 第64-66页 |
作者简历 | 第66-68页 |
学位论文数据集 | 第68页 |