首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于含噪短语音的鲁棒说话人识别研究

摘要第5-7页
Abstract第7-9页
1 绪论第14-31页
    1.1 说话人识别概述第14-18页
        1.1.1 说话人识别的研究意义与典型应用第14-16页
        1.1.2 说话人识别的发展与现状第16-18页
    1.2 说话人识别的分类第18-19页
    1.3 说话人识别系统结构第19-21页
        1.3.1 说话人识别系统结构第19-20页
        1.3.2 说话人辨认系统结构第20-21页
    1.4 说话人识别系统性能评价第21-22页
        1.4.1 说话人识别系统的性能评价第21-22页
        1.4.2 说话人辨认系统的性能评价第22页
    1.5 说话人识别的特征提取第22-24页
        1.5.1 说话人识别理想特征提取第22-23页
        1.5.2 说话人识别特征分类第23-24页
    1.6 说话人识别的主要模型第24-28页
        1.6.1 模板模型第24-25页
        1.6.2 统计模型第25-27页
        1.6.3 人工神经网络第27页
        1.6.4 支持向量机第27-28页
    1.7 本文研究工作概述第28-29页
    1.8 本文的结构安排第29-31页
2 含噪短语音说话人识别解决方案第31-44页
    2.1 引言第31页
    2.2 噪声的类型以及噪声的影响第31-32页
    2.3 短语音说话人识别研究第32-37页
    2.4 短语音说话人识别研究面临的困难第37-39页
    2.5 含噪短语音说话人识别综合性解决方案第39-43页
        2.5.1 语音的预处理第40-42页
        2.5.2 噪声的去除第42页
        2.5.3 语音帧的分类第42-43页
        2.5.4 多种特征的提取第43页
        2.5.5 识别模型的改进第43页
    2.6 本章小结第43-44页
3 基于多特征融合的含噪短语音说话人识别研究第44-74页
    3.1 引言第44-45页
    3.2 语音净化算法第45-48页
        3.2.1 噪声分离算法第45-46页
        3.2.2 差异检测与剔除算法第46-48页
    3.3 实验结果与分析--语音净化算法研究第48-50页
        3.3.1 实验语音库第48页
        3.3.2 语音预处理第48-49页
        3.3.3 初步噪声分离算法有效性研究第49页
        3.3.4 差异检测与剔除算法有效性研究第49-50页
    3.4 MFCC特征、ICAf特征、IMFCC特征及其组合的研究第50-55页
        3.4.1 提取MFCC特征、ICAf特征和IMFCC特征第51-53页
        3.4.2 特征组合模型训练第53-54页
        3.4.3 特征组合模型决策第54-55页
    3.5 实验结果与分析--MFCC特征、ICAf特征、IMFCC特征及其组合研究第55-56页
    3.6 提取WOCOR特征和特征组合MFCC_D_LPCC第56-62页
        3.6.1 WOCOR特征第57-58页
        3.6.2 特征组合MFCC_D_LPCC第58-60页
        3.6.3 实验结果与分析--单一特征参数研究第60-61页
        3.6.4 实验结果与分析--特征参数组合研究第61页
        3.6.5 WOCOR特征和特征组合MFCC_DLPCC相结合的说话人识别系统第61-62页
    3.7 特征组合中单一特征的融合系数优化第62-65页
        3.7.1 种群初始化第62-63页
        3.7.2 变异操作第63-64页
        3.7.3 交叉操作第64-65页
        3.7.4 选择操作第65页
    3.8 GMM模型和GMM-UBM模型第65-66页
    3.9 综合实验结果与分析第66-72页
        3.9.1 语音净化算法与单一特征及其组合的研究第67-68页
        3.9.2 识别模型与单一特征及其组合的研究第68-71页
        3.9.3 特征组合中单一特征的融合系数优化研究第71页
        3.9.4 测试人数对含噪短语音说话人识别率影响的研究第71-72页
    3.10 本章小结第72-74页
4 含噪短语音噪声分离算法和语音帧质量判别算法第74-87页
    4.1 引言第74页
    4.2 基于受限NMF的噪声分离算法CNMF第74-76页
    4.3 语音帧质量判别算法-ISNRDA第76-77页
        4.3.1 混合语音谱特征提取第76页
        4.3.2 改进信噪比判别算法第76-77页
    4.4 语音帧质量判别算法--差异检测与判别算法(DDADA)第77-78页
    4.5 基于受限NMF的信噪比判别算法(NMF-SNRDA)第78-79页
    4.6 基于GMM-UBM两阶段分类模型第79-80页
    4.7 实验结果与分析第80-86页
        4.7.1 实验语音库第80页
        4.7.2 噪声分离方法对识别率的影响第80-81页
        4.7.3 语音帧质量判别算法ISNRDA对识别率的影响第81页
        4.7.4 语音帧质量判别算法DDADA对识别率的影响第81-85页
        4.7.5 语音帧质量判别算法NMF-SNRDA对识别率的影响第85页
        4.7.6 四种语音帧质量判别算法的比较第85-86页
    4.8 本章小结第86-87页
5 双重信息质量判别算法和三阶段分类模型第87-100页
    5.1 双重信息质量判别算法第87页
    5.2 双重判别算法实验结果与分析第87-88页
    5.3 GMM-UBM三阶段分类模型第88-90页
    5.4 GMM-UBM三阶段分类模型实验结果与分析第90-92页
    5.5 局部模糊PCA降维第92-94页
        5.5.1 模糊K均值聚类算法第92-93页
        5.5.2 初始化聚类中心及其改进第93-94页
        5.5.3 PCA降维第94页
    5.6 基于模糊PCA的GMM第94-97页
    5.7 判决策略第97-98页
    5.8 实验结果与分析第98-99页
        5.8.1 模糊PCA降维实验第98页
        5.8.2 不同GMM参数初始化方法对识别率的影响第98-99页
    5.9 本章小结第99-100页
6 总结与展望第100-103页
    6.1 总结第100-101页
    6.2 研究展望第101-103页
致谢第103-104页
参考文献第104-120页
附录第120-121页

论文共121页,点击 下载论文
上一篇:基于动态规划的拉班舞谱自动生成研究
下一篇:面向人脸识别的图像表示和分类研究