| 摘要 | 第1-5页 |
| ABSTRACT | 第5-10页 |
| 1 绪论 | 第10-24页 |
| ·背景 | 第10-11页 |
| ·说话人识别 | 第11-16页 |
| ·说话人识别的分类 | 第12-14页 |
| ·说话人识别的模型的分类 | 第14-16页 |
| ·说话人识别的系统性能评价标准 | 第16-20页 |
| ·ROC曲线 | 第16页 |
| ·FA-FR曲线和等误识率 | 第16-18页 |
| ·检查代价函数 | 第18-19页 |
| ·DET曲线 | 第19-20页 |
| ·复杂环境下的说话人识别 | 第20-22页 |
| ·基于信号特征的噪音鲁棒算法 | 第21页 |
| ·基于模型的噪音鲁棒算法 | 第21-22页 |
| ·本文使用到的语料库 | 第22-23页 |
| ·TIMIT语音库 | 第22页 |
| ·NOISEX-92数据库 | 第22-23页 |
| ·论文的安排 | 第23-24页 |
| 2 说话人特征参数提取 | 第24-40页 |
| ·语音信号的预处理 | 第24-26页 |
| ·预加重(Pre-emphasis) | 第24-25页 |
| ·加窗处理(Frame Bloeking) | 第25-26页 |
| ·语音信号的特征参数的分类 | 第26-33页 |
| ·时域特征 | 第27-29页 |
| ·线性预测编码参数 | 第29-30页 |
| ·频域及倒谱特征 | 第30-33页 |
| ·基于听觉特征的参数 | 第33页 |
| ·LPCC | 第33-34页 |
| ·MTCC特征 | 第34-37页 |
| ·MFCC参数的具体计算过程 | 第35-37页 |
| ·临界带宽 | 第37页 |
| ·PLP参数 | 第37-39页 |
| ·PLP特征提取的过程 | 第37-39页 |
| ·小结 | 第39-40页 |
| 3 说话人识别中特征提取的鲁棒性 | 第40-53页 |
| ·Delta参数 | 第40-41页 |
| ·PCA | 第41-46页 |
| ·随机向量的kl展开 | 第43-44页 |
| ·kl降维的实现 | 第44-46页 |
| ·谱减法与非线性谱减法 | 第46-48页 |
| ·噪声谱的估计 | 第48页 |
| ·倒谱均值相减法(CMS) | 第48页 |
| ·倒谱均值与方差归一化法(CMVN) | 第48-49页 |
| ·RASTA | 第49-51页 |
| ·特征提取的RASTA-PLP技术 | 第49-51页 |
| ·特征弯折(Feature Warping) | 第51-52页 |
| ·本章小结 | 第52-53页 |
| 4 基于GMM-UBM说话人识别模型 | 第53-67页 |
| ·GMM模型 | 第53-58页 |
| ·GMM的参数估计 | 第55-58页 |
| ·一种新的抗噪特征参数用于GMM模型的说话人识别 | 第58-61页 |
| ·参数的提取 | 第58-60页 |
| ·实验结果 | 第60-61页 |
| ·基于高斯混合模型-通用背景模型(GMM-UBM)的说话人确认 | 第61-65页 |
| ·基于UBM-GMM说话人确认的的训练过程 | 第61-64页 |
| ·基于UBM-GMM说话人确认的确认过程 | 第64-65页 |
| ·GMM与GMM—UBM的性能比较 | 第65页 |
| ·本章小结 | 第65-67页 |
| 5 GMM和SVM的混合模型 | 第67-85页 |
| ·SVM模型 | 第67-77页 |
| ·研究意义 | 第67-68页 |
| ·基于风险最小的机器学习方法 | 第68-70页 |
| ·分类间隔最大 | 第70-72页 |
| ·线性判诀边界 | 第72页 |
| ·非线性判决边界 | 第72-77页 |
| ·SVM在说话人确认中的应用 | 第77-78页 |
| ·GMM-SVM系统 | 第78-82页 |
| ·SVM 概 输出 | 第80-82页 |
| ·基于GMM super vector线性核函数的SVM用于说话人确认系统 | 第82-84页 |
| ·本章总结 | 第84-85页 |
| 6 总结与展望 | 第85-87页 |
| ·工作总结 | 第85页 |
| ·工作展望 | 第85-87页 |
| 致谢 | 第87-88页 |
| 参考文献 | 第88-91页 |
| 附录 | 第91页 |