首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

音频场景检测机制的设计与实施

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-13页
    1.1 音频场景检测机制的研究背景和研究意义第9页
    1.2 音频场景检测机制的历史发展第9-10页
    1.3 论文的主要研究内容及研究成果第10-11页
    1.4 论文的组织结构第11-13页
第二章 音频场景检测机制的相关理论第13-27页
    2.1 引言第13页
    2.2 特征提取第13-16页
        2.2.1 音频帧特征第13-16页
        2.2.2 音频段特征第16页
    2.3 模型第16-19页
        2.3.1 高斯混合模型第16-18页
        2.3.2 HMM模型第18-19页
        2.3.3 K-means算法第19页
    2.4 非负矩阵分解第19-21页
        2.4.1 代价函数与迭代规则第20页
        2.4.2 NMF在音频领域的应用第20-21页
    2.5 分类器第21-24页
        2.5.1 K近邻分类器第21-22页
        2.5.2 决策树第22页
        2.5.3 支撑向量机第22-24页
    2.6 评估指标第24-26页
        2.6.1 DER评估指标第24-25页
        2.6.2 信源分离评估指标第25页
        2.6.3 语音质量的常用评价指标第25-26页
    2.7 本章小结第26-27页
第三章 音频场景检测机制的原理与技术第27-51页
    3.1 引言第27页
    3.2 两套场景检测基准系统第27-34页
        3.2.1 content基准系统第27-28页
        3.2.2 AS基准系统第28-31页
        3.2.3 实验结果及分析第31-34页
    3.3 参数更新第34-37页
        3.3.1 预分类语音码本更新第34-35页
        3.3.2 修正阶段语音阈值更新第35-36页
        3.3.3 实验结果及分析第36-37页
    3.4 语音检测的鲁棒性特征第37-42页
        3.4.1 SCF和LPVDR特征提取第37-39页
        3.4.2 特征辨识力实验及分析第39-42页
    3.5 音乐调性检测第42-44页
        3.5.1 基本乐理介绍及调性检测原理第43-44页
        3.5.2 实验设置及结果第44页
    3.6 基于NMF特征的语音非语音检测第44-49页
        3.6.1 特征提取与模型训练第45-47页
        3.6.2 系统性能评估第47-49页
    3.7 本章小结第49-51页
第四章 语音增强与音频场景检测第51-57页
    4.1 引言第51页
    4.2 基于NMF的语音增强算法第51-52页
    4.3 常见语音增强算法原理及相关实验第52-54页
    4.4 语音增强与基准系统的融合第54页
    4.5 实验结果及分析第54-55页
    4.6 本章小结第55-57页
第五章 在线音频场景检测系统第57-71页
    5.1 引言第57页
    5.2 在线话音检测第57-60页
        5.2.1 基于对数能量多高斯建模的话音检测第57-58页
        5.2.2 基于多特征流的在线话音检测第58-60页
    5.3 在线场景检测第60-66页
        5.3.1 语音与非语音分类第61-65页
        5.3.2 非语音分类第65-66页
    5.4 模型参数实时更新第66-67页
    5.5 实验结果及分析第67-68页
    5.6 本章小结第68-71页
第六章 总结与展望第71-73页
参考文献第73-77页
致谢第77-79页
攻读学位期间发表或已录用的学术论文第79页

论文共79页,点击 下载论文
上一篇:在线式开集说话人识别系统的设计与实施
下一篇:低轨移动通信卫星中频偏抑制技术的研究