首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

噪音环境下的说话人识别算法研究

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第11-17页
    1.1 课题研究的背景和意义第11页
    1.2 研究现状及应用第11-14页
        1.2.1 说话人识别的研究现状第12-14页
        1.2.2 说话人识别的研究应用第14页
    1.3 技术难点和解决办法第14-15页
        1.3.1 技术难点第14-15页
        1.3.2 解决办法第15页
    1.4 主要研究内容及章节安排第15-17页
第2章 说话人语音的预处理第17-27页
    2.1 语音的产生第17-18页
    2.2 语音信号的采样和量化第18-19页
    2.3 语音信号的预加重第19页
    2.4 语音信号的分帧及加窗处理第19-20页
    2.5 端点检测第20-26页
        2.5.1 短时能零积法第20-22页
        2.5.2 信息熵法第22-23页
        2.5.3 基于短时能零积和信息熵法第23-25页
        2.5.4 实验结果第25-26页
    2.6 本章小结第26-27页
第3章 卡尔曼滤波下的语音增强技术第27-38页
    3.1 语音信号的数学模型第27-28页
    3.2 离散型卡尔曼滤波第28-31页
        3.2.1 离散卡尔曼滤波通用方程第28-30页
        3.2.2 发散抑制第30-31页
    3.3 卡尔曼滤波下的语音增强第31-33页
        3.3.1 白噪声下的卡尔曼滤波第31-32页
        3.3.2 有色噪音下的卡尔曼滤波第32-33页
    3.4 本文下的卡尔曼语音应用改进第33-35页
    3.5 仿真结果第35-37页
    3.6 本章小结第37-38页
第4章 特征参数提取第38-58页
    4.1 说话人识别特征参数选择第38-39页
        4.1.1 说话人识别常用特征参数第38页
        4.1.2 特征参数的有效性第38-39页
    4.2 基音周期提取第39-44页
        4.2.1 浊音的准周期性第40-41页
        4.2.2 自相关函数法第41页
        4.2.3 短时平均幅差函数法第41页
        4.2.4 基于短时平均幅度差函数的算法改进第41-42页
        4.2.5 算法改进第42-43页
        4.2.6 基频检测改进第43-44页
    4.3 共振峰的提取第44-50页
        4.3.1 线性预测法提取共振峰第45-46页
        4.3.2 复倒谱法第46-47页
        4.3.3 共振峰提取的再处理第47-48页
        4.3.4 算法流程第48-50页
    4.4 线性预测系数第50-54页
        4.4.1 线性预测的基本原理第50页
        4.4.2 线性预测方程组第50-52页
        4.4.3 线性预测解法第52-53页
        4.4.4 线性预测倒谱系数第53-54页
    4.5 Mel频率倒谱系数第54-57页
        4.5.1 动态差分参数的提取第57页
    4.6 本章小结第57-58页
第5章 说话人识别模型第58-70页
    5.1 高斯混合模型第58-59页
    5.2 GMM参数训练第59-61页
    5.3 初始值确定第61-62页
    5.4 GMM模型初始化改进第62-67页
        5.4.1 聚类初始点选择第62-64页
        5.4.2 孤立点第64-65页
        5.4.3 聚类运算第65-67页
    5.5 GMM下的说话人确认和辨认第67-69页
        5.5.1 说话人辨认第68页
        5.5.2 说话人确认第68-69页
    5.6 本章小结第69-70页
第6章 说话人识别的实现第70-77页
    6.1 实验环境平台第70页
    6.2 GMM下的说话人识别研究第70-76页
        6.2.1 语音库第70页
        6.2.2 语音时长对识别的影响第70-71页
        6.2.3 特征参数对识别的影响第71-73页
        6.2.4 GMM混合数的影响第73-74页
        6.2.5 GMM方差阈值对识别的影响第74-75页
        6.2.6 K-means算法对识别效果的影响第75-76页
    6.3 改进的说话人识别性能第76页
    6.4 本章小结第76-77页
结论第77-79页
参考文献第79-83页
攻读硕士学位期间发表的论文和取得的科研成果第83-85页
致谢第85页

论文共85页,点击 下载论文
上一篇:钢管漏磁探伤监控系统的设计与实现
下一篇:基于磁导航的AGV转弯和校偏算法研究与设计