首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

复杂环境下说话人确认鲁棒性研究

摘要第3-4页
Abstract第4页
第1章 引言第9-27页
    1.1 研究背景及意义第10-11页
    1.2 说话人确认技术概述第11-16页
        1.2.1 声学特征提取第12-13页
        1.2.2 说话人建模及打分第13-15页
        1.2.3 说话人确认系统性能评价第15-16页
    1.3 说话人确认中面临的复杂环境问题第16-17页
    1.4 说话人确认鲁棒性研究现状第17-21页
        1.4.1 研究现状概述第17-18页
        1.4.2 研究现状分析第18-20页
        1.4.3 研究难点第20-21页
    1.5 研究工作概述第21-25页
        1.5.1 研究思路第21-23页
        1.5.2 工作内容第23-25页
    1.6 论文的组织结构第25-27页
第2章 基于频带加权的信道鲁棒特征提取第27-44页
    2.1 本章引论第27-29页
        2.1.1 研究问题第27页
        2.1.2 问题分析第27-28页
        2.1.3 研究思路第28-29页
    2.2 背景回顾第29-33页
        2.2.1 频带加权MFCC特征第29-30页
        2.2.2 F-ratio准则第30-32页
        2.2.3 i-vector与LDA第32-33页
    2.3 复杂信道下基于频带加权的特征提取第33-36页
        2.3.1 复杂信道下的频带整体区分度第33-34页
        2.3.2 基于F-ratio的频带加权参数提取第34-35页
        2.3.3 有效性分析第35页
        2.3.4 频带加权在i-vector系统中流程第35-36页
    2.4 实验评测与结果分析第36-43页
        2.4.1 相关数据库的选择第36-37页
        2.4.2 实验参数配置第37-38页
        2.4.3 同数据库F-ratio的加权测试第38-40页
        2.4.4 跨数据库F-ratio的加权测试第40-42页
        2.4.5 不同数据库提取的F-ratio参数比较第42-43页
    2.5 小结第43-44页
第3章 复杂信道下说话人空间的区分性训练第44-74页
    3.1 本章引论第44-48页
        3.1.1 科学问题第44页
        3.1.2 研究现状分析第44-45页
        3.1.3 问题分析第45-47页
        3.1.4 研究思路第47-48页
    3.2 研究现状分析第48-53页
        3.2.1 DNN回顾第48-51页
        3.2.2 说话人确认中的DNN第51-53页
    3.3 区分性训练数据集的设计第53页
    3.4 基于i-vector的区分性特征提取第53-57页
        3.4.1 余弦度量第54页
        3.4.2 幅度差值距离第54-57页
        3.4.3 区分性训练输入的设计第57页
    3.5 构建DNN区分性训练第57-59页
    3.6 PLDA-DNN的融合第59-62页
        3.6.1 PLDA概述第59-60页
        3.6.2 DNN与PLDA的融合第60-62页
    3.7 实验评测与结果分析第62-72页
        3.7.1 相关数据库的选择第62页
        3.7.2 实验配置与基线系统第62-63页
        3.7.3 利用CV集挑选DNN输入维度第63-65页
        3.7.4 不同隐藏层数对DNN区分性训练的影响第65-66页
        3.7.5 基于DNN区分性训练测试第66-67页
        3.7.6 DNN与PLDA融合实验第67-71页
        3.7.7 DNN与SVM的对比实验第71-72页
    3.8 小结第72-74页
第4章 基于顺序自适应的模型动态更新第74-94页
    4.1 本章引论第74-76页
        4.1.1 研究问题第74页
        4.1.2 问题分析第74-75页
        4.1.3 解决思路第75-76页
    4.2 基于MAP的通用背景模型的顺序自适应第76-82页
        4.2.1 MAP估计第77-79页
        4.2.2 UBM的动态更新第79-82页
    4.3 说话人高斯混合模型的自适应更新第82-84页
    4.4 基于fMAPLR的顺序自适应方法第84-86页
    4.5 基于MAP-fMAPLR顺序自适应第86-87页
    4.6 实验评测和结果分析第87-92页
        4.6.1 数据库和实验配置第87页
        4.6.2 UBM顺序更新实验结果第87-89页
        4.6.3 顺序更新后UBM的质量第89-90页
        4.6.4 GMM-UBM顺序更新实验结果第90-91页
        4.6.5 f MAPLR的顺序更新实验结果第91-92页
    4.7 小结第92-94页
第5章 总结和展望第94-97页
    5.1 论文工作总结第94-95页
    5.2 下一步研究展望第95-97页
参考文献第97-108页
致谢第108-111页
个人简历、在学期间发表的学术论文与研究成果第111-112页

论文共112页,点击 下载论文
上一篇:半滑舌鳎aqp1aa、lipocalin基因的克隆及表达分析
下一篇:钙钛矿型双功能氧电极LaNiO3的研究