摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
1 绪论 | 第10-24页 |
·背景 | 第10-11页 |
·说话人识别 | 第11-16页 |
·说话人识别的分类 | 第12-14页 |
·说话人识别的模型的分类 | 第14-16页 |
·说话人识别的系统性能评价标准 | 第16-20页 |
·ROC曲线 | 第16页 |
·FA-FR曲线和等误识率 | 第16-18页 |
·检查代价函数 | 第18-19页 |
·DET曲线 | 第19-20页 |
·复杂环境下的说话人识别 | 第20-22页 |
·基于信号特征的噪音鲁棒算法 | 第21页 |
·基于模型的噪音鲁棒算法 | 第21-22页 |
·本文使用到的语料库 | 第22-23页 |
·TIMIT语音库 | 第22页 |
·NOISEX-92数据库 | 第22-23页 |
·论文的安排 | 第23-24页 |
2 说话人特征参数提取 | 第24-40页 |
·语音信号的预处理 | 第24-26页 |
·预加重(Pre-emphasis) | 第24-25页 |
·加窗处理(Frame Bloeking) | 第25-26页 |
·语音信号的特征参数的分类 | 第26-33页 |
·时域特征 | 第27-29页 |
·线性预测编码参数 | 第29-30页 |
·频域及倒谱特征 | 第30-33页 |
·基于听觉特征的参数 | 第33页 |
·LPCC | 第33-34页 |
·MTCC特征 | 第34-37页 |
·MFCC参数的具体计算过程 | 第35-37页 |
·临界带宽 | 第37页 |
·PLP参数 | 第37-39页 |
·PLP特征提取的过程 | 第37-39页 |
·小结 | 第39-40页 |
3 说话人识别中特征提取的鲁棒性 | 第40-53页 |
·Delta参数 | 第40-41页 |
·PCA | 第41-46页 |
·随机向量的kl展开 | 第43-44页 |
·kl降维的实现 | 第44-46页 |
·谱减法与非线性谱减法 | 第46-48页 |
·噪声谱的估计 | 第48页 |
·倒谱均值相减法(CMS) | 第48页 |
·倒谱均值与方差归一化法(CMVN) | 第48-49页 |
·RASTA | 第49-51页 |
·特征提取的RASTA-PLP技术 | 第49-51页 |
·特征弯折(Feature Warping) | 第51-52页 |
·本章小结 | 第52-53页 |
4 基于GMM-UBM说话人识别模型 | 第53-67页 |
·GMM模型 | 第53-58页 |
·GMM的参数估计 | 第55-58页 |
·一种新的抗噪特征参数用于GMM模型的说话人识别 | 第58-61页 |
·参数的提取 | 第58-60页 |
·实验结果 | 第60-61页 |
·基于高斯混合模型-通用背景模型(GMM-UBM)的说话人确认 | 第61-65页 |
·基于UBM-GMM说话人确认的的训练过程 | 第61-64页 |
·基于UBM-GMM说话人确认的确认过程 | 第64-65页 |
·GMM与GMM—UBM的性能比较 | 第65页 |
·本章小结 | 第65-67页 |
5 GMM和SVM的混合模型 | 第67-85页 |
·SVM模型 | 第67-77页 |
·研究意义 | 第67-68页 |
·基于风险最小的机器学习方法 | 第68-70页 |
·分类间隔最大 | 第70-72页 |
·线性判诀边界 | 第72页 |
·非线性判决边界 | 第72-77页 |
·SVM在说话人确认中的应用 | 第77-78页 |
·GMM-SVM系统 | 第78-82页 |
·SVM 概 输出 | 第80-82页 |
·基于GMM super vector线性核函数的SVM用于说话人确认系统 | 第82-84页 |
·本章总结 | 第84-85页 |
6 总结与展望 | 第85-87页 |
·工作总结 | 第85页 |
·工作展望 | 第85-87页 |
致谢 | 第87-88页 |
参考文献 | 第88-91页 |
附录 | 第91页 |