首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

声纹识别中说话方式可靠性研究

摘要第4-6页
Abstract第6-7页
第一章 绪论第9-17页
    1.1 声纹识别应用背景第9-11页
        1.1.1 声纹识别技术概述第9-10页
        1.1.2 声纹识别技术应用第10-11页
    1.2 选题背景与意义第11-14页
        1.2.1 说话人说话方式变化的影响第11-13页
        1.2.2 说话方式中发声力度的研究现状与不足第13-14页
    1.3 研究思路第14-15页
    1.4 论文组织结构第15-17页
第二章 不同发声力度下语音信号分析第17-25页
    2.1 正常、耳语、高喊语音声学特征分析第17-20页
        2.1.1 语音的声学参数介绍第17-20页
    2.2 模型分布可视化第20-22页
        2.2.1 t-SNE降维方法第20-21页
        2.2.2 模型分布可视化分析第21-22页
    2.3 发声力度相关的声纹识别数据库的设置与录制第22-23页
    2.4 本章小结第23-25页
第三章 基于GMM-UBM的声纹识别系统第25-35页
    3.1 基于高斯混合模型的声纹识别第25-30页
        3.1.1 说话人辨认系统第25-26页
        3.1.2 说话人确认系统第26-28页
        3.1.3 前端处理第28-30页
    3.2 基于高斯混合模型-通用背景模型的声纹识别第30-32页
        3.2.1 通用背景模型第30页
        3.2.2 说话人模型自适应第30-32页
    3.3 声纹识别性能评价标准第32-33页
        3.3.1 错误接受率和错误拒绝率第32-33页
        3.3.2 等错误概率第33页
    3.4 本文基线系统说明第33页
    3.5 基线系统实验与结果第33-34页
    3.6 本章小结第34-35页
第四章 模型和特征变换第35-43页
    4.1 线性发声力度模型和特征变换第35-38页
        4.1.1 最大线性似然回归(MLLR)第35-36页
        4.1.2 基于MLLR的模型投影变换第36-37页
        4.1.3 约束最大线性似然回归(CMLLR)第37-38页
        4.1.4 基于CMLLR的特征空间投影变换第38页
    4.2 实验与结果第38-41页
    4.3 本章小结第41-43页
第五章 特征与模型的联合优化第43-53页
    5.1 发声力度最大后验概率自适应第43-47页
        5.1.1 最大后验概率(MAP)第43页
        5.1.2 MAP方法测试方案第43-44页
        5.1.3 实验结果第44-47页
    5.2 最大后验概率+约束最大似然线性(MAP+CMLLR)第47-52页
        5.2.1 MAP+CMLLR测试方案第48-49页
        5.2.2 实验与结果第49-52页
    5.3 本章小结第52-53页
第六章 总结与展望第53-57页
    6.1 论文工作总结第53-54页
    6.2 下一步工作展望第54-57页
致谢第57-59页
参考文献第59-63页
攻读硕士学位期间取得的学术成果第63-65页

论文共65页,点击 下载论文
上一篇:基于物联网架构的自助终端运行平台研究
下一篇:面向雪崩光电二极管的光子计数读出电路设计