一种说话人识别系统的设计与实现
【摘要】:在信息技术高速发展的今天,信息的安全成为了世人越来越关注的话题。生物识别技术因其方便、经济、准确等特点,是当前信息安全领域研究和发展的热点。说话人识别技术是生物识别技术的重要组成部分,原理是通过对语音特征的提取与分析匹配,最终判断和确认用户的身份。数十年来,在科研工作者的不断努力下,说话人识别技术取得了长足的发展和进步。本文主要就说话人识别系统的设计与实现进行了研究和分析。文章设计了一种说话人识别系统,通过对说话人识别系统各个组成模块的原理分析和仿真实现,测试分析了在不同维数、不同测试人数和测试时间、不同特征参数及不同端点检测方法等情况下,对说话人识别系统性能的影响。本文具体完成的工作如下:分析研究了窗函数和语音信号端点检测的原理及应用,通过实验的验证,对各个函数及方法进行了性能的比较,论证了其可行性;研究实现了一种基于混沌特征的端点检测方法,实验表明,这种方法能更好的排除噪声干扰,实现噪声和话音信号的有效区分。研究分析了语音信号特征提取和说话人识别方法的原理和实现方法,分析比较了几种特征参数的性能,通过仿真实验的验证,分析研究了这些特征参数对系统性能的影响;从LPCC、MFCC的理论及实现出发,研究实现了一种MFCC加差分MFCC的特征参数,通过有效性分析和实验表明,加入了动态特征的MFCC参数能更好的表征说话人语音的特征;研究了MFCC参数特征提取计算过程中的浮点数定点化实现。通过实验,测试了其精度和识别率问题,研究分析了对系统性能的影响。研究分析了混合高斯模型和矢量量化作为说话人识别方法的基本原理和过程,研究了其识别算法,通过实验对两种方法进行了性能分析。论文运用Matlab设计了一种基于GMM的说话人识别系统,对实现后的系统进行了多种条件下的数据测试和理论分析,论证了该系统能基本满足工程上的性能要求。
【关键词】:说话人识别 高斯混合模型 嵌入维 MEL倒谱系数
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.41