首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

基于帧级和段级稀疏表示的说话人识别研究

摘要第4-6页
Abstract第6-7页
第1章 绪论第14-25页
    1.1 课题研究目的及意义第14-15页
    1.2 国内外研究现状第15-21页
        1.2.1 经典的说话人识别方法第15-17页
        1.2.2 基于稀疏表示的说话人识别方法第17-21页
    1.3 目前存在的主要问题第21-22页
    1.4 本文主要研究内容第22-25页
第2章 稀疏表示和说话人识别第25-43页
    2.1 引言第25-26页
    2.2 稀疏表示理论第26-30页
        2.2.1 稀疏分解第28-29页
        2.2.2 字典学习第29-30页
    2.3 说话人识别系统的基本组成第30-40页
        2.3.1 特征提取第30-37页
        2.3.2 模型训练第37-39页
        2.3.3 模型匹配第39页
        2.3.4 融合信息第39-40页
    2.4 说话人识别系统的评价指标第40页
    2.5 说话人识别系统的语料库第40-42页
    2.6 本章小结第42-43页
第3章 基于帧级字典原子活跃度模型的说话人识别第43-57页
    3.1 引言第43-44页
    3.2 原子活跃度模型的构建第44-48页
        3.2.1 字典原子激活状态表示第44-45页
        3.2.2 峰度第45-46页
        3.2.3 字典原子活跃度模型第46-48页
    3.3 动态阈值确定第48-51页
    3.4 实验结果与分析第51-55页
    3.5 本章小结第55-57页
第4章 基于帧级联合字典和系数池化鲁棒说话人识别第57-81页
    4.1 引言第57-58页
    4.2 基于语音和噪声联合字典的稀疏表示第58-62页
    4.3 基于稀疏表示的池化特征第62-66页
        4.3.1 最大值池化操作第63-64页
        4.3.2 平均值池化操作第64-66页
    4.4 余弦相似度判决准则第66-67页
    4.5 实验结果与分析第67-80页
        4.5.1 最大值池化操作结果评估第67-76页
        4.5.2 平均值池化操作结果评估第76-80页
    4.6 本章小结第80-81页
第5章 基于段级字典判别性学习的说话人识别第81-98页
    5.1 引言第81-82页
    5.2 Fisher准则第82-84页
    5.3 Fisher判别字典学习第84-91页
        5.3.1 简化FDDL模型第85-87页
        5.3.2 优化FDDL模型第87-91页
    5.4 基于FDDL的说话人识别第91-92页
    5.5 实验结果与分析第92-96页
        5.5.1 基于FDDL的说话人识别系统第93-94页
        5.5.2 基于i-CDS和FDDL融合的说话人识别系统第94-95页
        5.5.3 不同判别字典学习方法的对比第95-96页
    5.6 本章小结第96-98页
第6章 基于块稀疏贝叶斯分解的说话人识别第98-112页
    6.1 引言第98-99页
    6.2 稀疏贝叶斯第99-103页
    6.3 块稀疏贝叶斯第103-105页
    6.4 基于块稀疏贝叶斯分解的说话人识别第105-108页
        6.4.1 字典构成第106页
        6.4.2 块稀疏贝叶斯分解第106-108页
    6.5 实验结果与分析第108-111页
    6.6 本章小结第111-112页
结论第112-114页
参考文献第114-125页
攻读博士学位期间发表的论文及其它成果第125-127页
致谢第127-128页
个人简历第128页

论文共128页,点击 下载论文
上一篇:出租车过度管制的制度成因及其福利影响研究
下一篇:LaMnO3纳米棒—还原氧化石墨烯复合材料的制备及光催化性能研究