首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

支持开集的语者识别系统的设计与实施

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-15页
    1.1 课题研究背景第9-10页
    1.2 说话人识别的发展历史和研究现状第10-11页
    1.3 论文的主要工作第11-12页
    1.4 论文的研究成果第12页
    1.5 论文的组织结构第12-15页
第二章 说话人识别技术概述第15-27页
    2.1 说话人识别的概念第15页
    2.2 说话人识别的类型说明第15-16页
    2.3 说话人识别系统的基本设计方案第16-17页
    2.4 语音特征的提取第17-19页
        2.4.1 特征的概念第17页
        2.4.2 MFCC特征提取第17-19页
    2.5 基于混合高斯模型的建模匹配方案第19-24页
        2.5.1 混合高斯模型(GMM)的形式及其匹配方式第19-21页
        2.5.2 GMM-UBM体系第21-24页
    2.6 说话人识别系统的性能评价第24-26页
    2.7 本章小结第26-27页
第三章 开集识别的相关理论研究第27-35页
    3.1 开集说话人识别系统设计架构第27-28页
    3.2 得分规整第28-31页
        3.2.1 WMN(world model normalization)第28-29页
        3.2.2 CN(Cohort Normalization)第29页
        3.2.3 UCN(Unconstrained Cohort Normalization)第29-30页
        3.2.4 Z-norm第30页
        3.2.5 T-norm第30-31页
    3.3 阈值训练方案的设定第31-34页
        3.3.1 基于统计的阈值设定第32-33页
        3.3.2 数据裁剪算法第33-34页
    3.4 本章小结第34-35页
第四章 快速说话人识别第35-47页
    4.1 说话人快速识别的概念第35-36页
    4.2 模型距离计算第36-38页
        4.2.1 欧氏距离(Euclidean Distance)第36页
        4.2.2 混合高斯KL距离(GMM-based KL)第36-37页
        4.2.3 高斯KL距离(Gaussian-based KL)第37-38页
    4.3 说话人聚类第38-44页
        4.3.1 k均值(k-means)聚类第38-39页
        4.3.2 canopy粗聚类第39-41页
        4.3.3 改进的说话人聚类第41-44页
    4.4 快速说话人识别方案第44-45页
    4.5 基于快速搜索的规整方案和阈值判决第45-46页
    4.6 本章小结第46-47页
第五章 系统实现与实验结果第47-59页
    5.1 系统实现中的优化处理第47-48页
    5.2 开集的说话人识别系统架构第48页
    5.3 系统参数设定的相关实验第48-55页
        5.3.1 特征提取第48-50页
        5.3.2 模型的训练和匹配第50-53页
        5.3.3 得分规整对系统性能的影响第53-55页
    5.4 系统性能测评第55-58页
        5.4.1 说话人聚类性能测试第55-56页
        5.4.2 快速开集说话人识别准确度第56-58页
    5.5 本章小结第58-59页
第六章 总结与展望第59-61页
    6.1 论文工作总结第59页
    6.2 未来工作展望第59-61页
参考文献第61-65页
致谢第65-67页
攻读学位期间发表的学术论文目录第67页

论文共67页,点击 下载论文
上一篇:农村高中英语后进生的成因及对策--以慈利县第二中学为例
下一篇:依据输入和输出理论优化高中英语家庭作业--以深圳宝安第一外国语学校为例