首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

噪声环境下的说话人识别技术

摘要第3-4页
Abstract第4页
1 绪论第9-19页
    1.1 引言第9页
    1.2 研究背景与意义第9-11页
    1.3 说话人识别的发展第11-12页
    1.4 说话人识别系统概述第12-15页
        1.4.1 说话人识别的分类和基本组成第12-13页
        1.4.2 说话人识别的特征选取第13-14页
        1.4.3 说话人识别的主要方法第14-15页
    1.5 噪声环境下的说话人识别研究现状及难点第15-18页
        1.5.1 噪声的分类及影响第16页
        1.5.2 噪声环境下说话人识别的基本方法第16-18页
        1.5.3 噪声环境下的研究难点第18页
    1.6 本文的组织结构安排第18-19页
2 说话人识别基本原理第19-34页
    2.1 语音信号预处理第19-24页
        2.1.1 语音信号的预加重第19-20页
        2.1.2 语音信号的分帧和加窗第20-22页
        2.1.3 语音信号的端点检测第22-24页
    2.2 语音信号特征参数的提取第24-30页
        2.2.1 线性预测系数LPC第25-26页
        2.2.2 线性预测倒谱系数LPCC第26-27页
        2.2.3 梅尔频率倒谱系数MFCC第27-28页
        2.2.4 感知线性预测倒谱系数PLPC第28-30页
    2.3 高斯混合模型GMM第30-33页
        2.3.1 GMM模型的基本概念第30-31页
        2.3.2 GMM模型的参数估计第31-32页
        2.3.3 GMM模型参数初始化第32页
        2.3.4 GMM模型的识别问题第32-33页
    2.4 本章小结第33-34页
3 语音信号的端点检测技术及其改进第34-41页
    3.1 基于CO复杂度的端点检测第34-35页
    3.2 基于MFCC相似度的端点检测第35-36页
    3.3 基于改进C0复杂度和MFCC相似度相结合的端点检测第36页
    3.4 三种端点检测算法的对比实验第36-40页
        3.4.1 实验准备第36页
        3.4.2 实验结果分析第36-40页
        3.4.3 实验小结第40页
    3.5 本章小结第40-41页
4 信号空间抗噪技术的改进及对识别性能的影响第41-56页
    4.1 谱减法第41-43页
        4.1.1 基本谱减法第41-42页
        4.1.2 基本谱减法的改进第42-43页
    4.2 维纳滤波法第43-45页
        4.2.1 传统的维纳滤波法第43-44页
        4.2.2 基于先验信噪比估计的维纳滤波法第44-45页
    4.3 改进的维纳滤波法第45-46页
    4.4 语音增强方法的性能评价标准第46-47页
        4.4.1 信噪比第46-47页
        4.4.2 失真测度第47页
    4.5 语音增强算法的抗噪性能对比试验第47-52页
        4.5.1 实验准备第47页
        4.5.2 实验分析第47-52页
        4.5.3 实验小结第52页
    4.6 语音增强算法的识别性能对比实验第52-55页
        4.6.1 实验准备第53页
        4.6.2 实验分析第53-54页
        4.6.3 实验小结第54-55页
    4.7 本章小结第55-56页
5 特征空间抗噪技术的改进及对识别性能的影响第56-64页
    5.1 梅尔频率倒谱系数的相关参数及改进第56-58页
        5.1.1 MFCC参数第56页
        5.1.2 MFCC参数的扩展及改进第56-58页
    5.2 PLPC参数的扩展及改进第58-60页
        5.2.1 感知线性预测系数PLPC第58页
        5.2.2 感知对数面积比PLAR第58-60页
        5.2.3 改进的感知对数面积比mPLAR第60页
    5.3 mMFCC_D_D与mPLAR的特征融合第60-62页
        5.3.1 串行特征融合第61页
        5.3.2 主成份分析(PCA)第61-62页
    5.4 特征参数的识别性能对比实验第62-63页
        5.4.1 实验准备第62页
        5.4.2 说话人识别率对比分析第62-63页
        5.4.3 实验小结第63页
    5.5 本章小结第63-64页
6 总结及展望第64-65页
致谢第65-66页
参考文献第66-69页
附录第69页

论文共69页,点击 下载论文
上一篇:基于分布式框架的网络事件实时感知系统
下一篇:珠三角地区水稻邻苯二甲酸酯污染特征研究