基于MFCC特征和GMM模型的说话人识别系统研究
摘要 | 第1-9页 |
Abstract | 第9-13页 |
第1章 绪论 | 第13-19页 |
·说话人识别研究背景与意义 | 第13-14页 |
·说话人识别发展历史和研究现状 | 第14-17页 |
·论文工作的主要内容 | 第17-19页 |
第2章 说话人识别技术概述 | 第19-24页 |
·说话人识别系统基本组成 | 第19-21页 |
·说话人识别的分类 | 第21-22页 |
·说话人识别系统的性能评价标准 | 第22-23页 |
·本章小结 | 第23-24页 |
第3章 说话人识别预处理与特征提取 | 第24-38页 |
·说话人识别预处理 | 第24-27页 |
·说话人识别特征提取 | 第27-30页 |
·基于谱减法增强的MFCC特征参数提取 | 第30-34页 |
·基于谱减法的语音增强 | 第30-32页 |
·改进的谱减法 | 第32页 |
·基于谱减法增强的MFCC参数提取 | 第32-33页 |
·基于谱减法增强的前端处理实验 | 第33-34页 |
·混合加权MFCC与ΔMFCC的特征参数 | 第34-36页 |
·MFCC的一阶差分倒谱系数 | 第34页 |
·VQ系统下的改进特征参数加权 | 第34-35页 |
·基于混合加权MFCC与ΔMFCC的实验 | 第35-36页 |
·本章小结 | 第36-38页 |
第4章 基于VQ的说话人识别系统研究 | 第38-48页 |
·VQ说话人识别系统基本结构 | 第38页 |
·矢量量化的基本原理 | 第38-40页 |
·VQ的失真测度 | 第40页 |
·VQ码本设计的LBG算法 | 第40-42页 |
·LBG算法实现 | 第40-41页 |
·初始码本的选定 | 第41-42页 |
·系统具体实现 | 第42-44页 |
·系统模型的训练与识别 | 第42-44页 |
·实验结果及其分析 | 第44-47页 |
·码本容量对说话人识别系统性能的影响 | 第45-46页 |
·不同训练和测试样本对说话人识别系统性能的影响 | 第46-47页 |
·本章小结 | 第47-48页 |
第5章 基于GMM的说话人识别系统研究 | 第48-61页 |
·基于GMM的说话人识别系统的组成结构 | 第48页 |
·高斯混合模型GMM | 第48-53页 |
·高斯混合模型描述 | 第48-49页 |
·GMM模型参数估计 | 第49-51页 |
·模型参数初始化 | 第51-53页 |
·高斯混合模型系统具体实现 | 第53-56页 |
·GMM系统模型的训练与识别 | 第53-56页 |
·实验结果及其分析 | 第56-60页 |
·测试语音长度对系统识别率的影响 | 第56-57页 |
·不同特征参数对系统识别率的影响 | 第57-58页 |
·GMM混合度对系统识别率的影响 | 第58-59页 |
·噪声环境下说话人识别系统分析 | 第59-60页 |
·本章小结 | 第60-61页 |
总结与展望 | 第61-63页 |
工作总结 | 第61页 |
未来展望 | 第61-63页 |
参考文献 | 第63-67页 |
致谢 | 第67-68页 |
附录A 攻读硕士学位期间所发表的论文 | 第68页 |