首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于GMM的声纹识别技术的研究

摘要第1-5页
ABSTRACT第5-11页
第一章 绪论第11-20页
   ·课题研究背景第11页
   ·声纹识别概述第11-12页
   ·说话人识别的应用第12-13页
   ·说话人识别的发展历史和现状第13-14页
   ·说话人识别的系统架构第14-15页
   ·说话人识别中的语音特征第15-16页
   ·说话人识别中的建模第16-17页
     ·非参数模型第16页
     ·参数模型第16-17页
   ·说话人识别中的补偿技术第17-18页
     ·非模板补偿技术第17-18页
     ·基于模板的补偿技术第18页
   ·说话人识别的难点第18-19页
   ·本文结构安排第19-20页
第二章 语音信号的分析第20-30页
   ·语音信号的产生第20-21页
   ·语音信号的数字模型第21-22页
   ·语音信号的预处理第22-24页
     ·采样与量化第22页
     ·语音信号的预加重第22-23页
     ·分帧后加窗第23-24页
   ·语音信号的时域分析第24-27页
     ·短时能量和短时过零率第25页
     ·短时自相关函数第25-26页
     ·语音信号的端点检测第26-27页
   ·语音信号的频域分析第27-28页
     ·语音信号的短时傅里叶变换第27页
     ·小波变换在语音分析中的应用第27-28页
     ·语音信号的同态解卷积第28页
   ·语音信号的倒谱分析第28-29页
   ·语音信号的特征评价标准第29-30页
第三章 特征参数提取方案与设计第30-46页
   ·基音周期估计第30-33页
     ·基音周期的检测方法第30-32页
     ·基音周期的提取步骤第32-33页
   ·线性预测(LPC)以及其倒谱系数 LPCC第33-35页
     ·线性预测的基本原理第33-34页
     ·LPCC 的提取第34-35页
   ·基于听觉特性的 MEL 频率第35-37页
   ·梅尔倒谱频率参数的提取第37-44页
   ·梅尔倒谱频率的改进第44-46页
     ·凯泽窗(KAISER WINDOWING)第44页
     ·取 FFT 的绝对值第44页
     ·加权的 MFCC第44-46页
第四章 识别模型的方案与设计第46-64页
   ·单一高斯概率密度函数第46-47页
   ·高斯混合密度函数第47-49页
   ·说话人识别模型训练第49-50页
   ·模型的参数估计第50-51页
   ·EM 算法第51-52页
   ·EM 算法的初始化第52-55页
     ·K-均值算法第52-54页
     ·LBG 算法第54-55页
   ·说话人识别的判决法则第55-56页
     ·说话人辨认第55-56页
     ·说话人确认第56页
   ·改进的 GMM 模型第56-58页
   ·识别率改进方案第58-61页
   ·DTW 算法第61-64页
第五章 系统实现和实验结果第64-80页
   ·实验条件第64页
   ·实验语音库第64页
   ·基于 GMM 说话人识别系统架构第64-65页
   ·识别率计算第65页
   ·系统实现和程序设计第65-72页
   ·实验和结果分析第72-79页
     ·LPCC 和 MFCC 的实验比比较第72页
     ·高斯混合模型阶数大小对识别的影响第72-75页
     ·MFCC 维数对识别结果的影响第75-76页
     ·实验加入动态 MFCC第76-77页
       ·改进的加权 WMFCC 实验第77-78页
       ·加入基音周期的实验第78-79页
   ·基于改进的帧投票判决方法第79-80页
第六章 总结和展望第80-82页
   ·总结第80页
   ·未来展望第80-82页
致谢第82-83页
参考文献第83-87页
攻读硕士学位期间取得的研究成果第87-88页

论文共88页,点击 下载论文
上一篇:基于声换能器的“猫眼”逆向光调制技术及应用
下一篇:基于3G网络的车险理赔移动视频查勘