首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于GMM的说话人语音识别研究与实践

论文摘要第1-7页
ABSTRACT第7-10页
第1章 绪论第10-17页
   ·引言第10页
   ·说话人识别技术导引第10-15页
     ·说话人识别的研究背景和意义第10-12页
     ·说话人识别技术的发展简史第12-14页
     ·说话人识别技术的应用领域和前景第14-15页
   ·论文的组织结构第15-17页
第2章 说话人识别概论第17-26页
   ·说话人识别的概念第17页
   ·说话人识别的分类第17-19页
   ·说话人识别的原理和结构第19-20页
   ·说话人识别的常用方法第20-23页
   ·说话人识别技术的性能评价标准第23-24页
   ·说话人识别的难点第24-25页
   ·本章小结第25-26页
第3章 语音信号处理及其特征提取第26-38页
   ·语音信号产生的机理第26-28页
   ·语音信号预处理第28-30页
     ·采样与量化第28页
     ·归一化处理(normalization)第28-29页
     ·语音信号的预加重(pre-emphasis)第29页
     ·语音信号的分帧与加窗第29-30页
   ·特征参数的提取第30-37页
     ·特征参数的基本概念第30-31页
     ·线性预测系数(LPC)和线性预测倒谱系数(LPCC)第31-32页
     ·Mel频率倒谱系数(MFCC)第32-37页
   ·本章小结第37-38页
第4章 高斯混合模型及其辨认训练算法第38-52页
   ·高斯混合模型的基本概念第38-43页
     ·高斯混合模型的定义第39-41页
     ·高斯混合模型的阶数第41页
     ·高斯混合模型的说话人识别中的应用第41-43页
   ·EM算法第43-47页
     ·EM算法的引入第43页
     ·EM算法的介绍和初始化第43-44页
     ·EM算法在说话人识别中的应用第44-47页
   ·最大模型距离法(MMD)第47-50页
   ·实际应用中存在的几个问题第50-51页
   ·本章小结第51-52页
第5章 系统构架实现与数据测试比较第52-63页
   ·软硬件平台第52页
   ·实验及训练语音库第52-53页
   ·系统的数据流和模块第53-55页
   ·识别率计算第55页
   ·系统搭建完成后的验证测试第55-60页
     ·预加重系数对系统性能的影响第55-57页
     ·MFCC各维参数进行加权处理对系统的影响第57-58页
     ·GMM模型阶数对系统性能的影响第58-59页
     ·测试语音单位长度对系统性能的影响第59-60页
   ·本论文所做的尝试与改进第60-62页
     ·将多线程并行技术应用于说话人识别中第60-61页
     ·一种提升含样本量较大待测语音库识别率的方法第61-62页
   ·本章小结第62-63页
第6章 总结与展望第63-65页
   ·本文已取得的研究成果第63页
   ·有待进一步研究的工作第63-65页
发表论文和科研情况说明第65-66页
参考文献第66-69页
后记第69页

论文共69页,点击 下载论文
上一篇:两种前向安全的数字签名研究
下一篇:基于代理服务器的高效流媒体缓存技术研究