首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

具备鲁棒性的说话人分割机制的设计与实施

摘要第5-6页
ABSTRACT第6页
第一章 绪论第10-14页
    1.1 说话人分割机制的研究背景和研究意义第10页
    1.2 说话人分割机制的历史发展第10-12页
    1.3 说话人分割机制中存在的问题第12页
    1.4 论文的主要研究内容及研究成果第12-13页
    1.5 论文的组织结构第13-14页
第二章 说话人分割机制相关理论第14-20页
    2.1 引言第14页
    2.2 特征提取第14-17页
        2.2.1 梅尔频率倒谱系数第14页
        2.2.2 均方根能量第14-15页
        2.2.3 谐波特性第15-16页
        2.2.4 线性预测残差能量第16页
        2.2.5 谱平稳度第16页
        2.2.6 谱流量第16-17页
    2.3 距离计算第17-18页
    2.4 说话人分割机制的性能评价第18页
    2.5 本章小结第18-20页
第三章 基础性说话人分割机制的原理与架构第20-28页
    3.1 引言第20页
    3.2 基础性说话人分割机制的原理与架构第20-25页
        3.2.1 静音检测第21-22页
        3.2.2 预分割第22-23页
        3.2.3 说话人模型更新第23-24页
        3.2.4 潜在切换点确认第24-25页
    3.3 实验结果及分析第25-26页
        3.3.1 实验配置第25页
        3.3.2 实验结果与分析第25-26页
    3.4 本章小结第26-28页
第四章 说话人分割中的语音检测机制第28-46页
    4.1 引言第28-29页
    4.2 语音非语音检测第29-42页
        4.2.1 基于DNN的语音非语音检测系统第29-32页
        4.2.2 基于Combo的语音非语音检测系统第32-34页
        4.2.3 基于系统融合的两步判决语音非语音检测系统第34-36页
        4.2.4 实验结果与分析第36-42页
    4.3 基于GBDT的重叠语音检测系统第42-43页
    4.4 语音检测机制在说话人分割中的实验结果及分析第43-44页
        4.4.1 实验配置第43页
        4.4.2 实验结果与分析第43-44页
    4.5 本章小结第44-46页
第五章 说话人分割中的语音增强机制第46-58页
    5.1 引言第46-47页
    5.2 常用的基于深度学习的单声道语音增强算法第47-49页
        5.2.1 基于语音幅度谱估计的语音增强算法第47-48页
        5.2.2 基于时频掩蔽估计的语音增强算法第48-49页
    5.3 基于FFT-Mask估计的LSTM语音增强系统第49-55页
        5.3.1 基本原理第50页
        5.3.2 特征提取第50-51页
        5.3.3 网络结构和训练第51页
        5.3.4 音频重建第51-52页
        5.3.5 实验结果与分析第52-55页
    5.4 语音增强机制在说话人分割中的实验结果及分析第55-57页
        5.4.1 实验配置第55页
        5.4.2 实验结果与分析第55-57页
    5.5 本章小结第57-58页
第六章 总结与展望第58-60页
    6.1 论文工作总结第58页
    6.2 未来工作展望第58-60页
参考文献第60-64页
致谢第64-66页
攻读学位期间发表或已录用的学术论文第66页

论文共66页,点击 下载论文
上一篇:短语依赖型语者识别系统的设计与实施
下一篇:高速光纤通信系统中色散估计算法的研究