首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

基于听觉场景分析的主旋律提取

摘要第4-6页
ABSTRACT第6-8页
第一章 绪论第11-15页
    1.1 研究背景与意义第11-12页
    1.2 研究现状及问题第12-14页
    1.3 论文结构第14-15页
第二章 计算听觉场景分析第15-29页
    2.1 简介第15-16页
    2.2 听觉外围第16-18页
        2.2.1 中耳外耳预放大第16页
        2.2.2 耳蜗滤波和滤波器第16-17页
        2.2.3 内耳毛细胞Meddis模型第17-18页
    2.3 听觉图表示第18-23页
        2.3.1 自相关第18-19页
        2.3.2 互相关第19-20页
        2.3.3 频谱转移图第20-23页
        2.3.4 起始/截止图第23页
    2.4 音源分离第23-28页
        2.4.1 听觉元素第23-24页
        2.4.2 基于基频分组第24-27页
        2.4.3 基于共同的onset和offset分组第27页
        2.4.4 听觉场景搜索第27-28页
        2.4.5 音源再合成第28页
    2.5 小结第28-29页
第三章 信号预处理第29-42页
    3.1 弦乐/打击乐器声音分离第29-34页
        3.1.1 基于信息散度混合模型第31-33页
        3.1.2 基于强假设混合模型第33-34页
    3.2 低通滤波第34-35页
    3.3 实验结果第35-40页
        3.3.1 HPSS实验结果第35-38页
        3.3.2 低通滤波实验结果第38-40页
    3.4 小结第40-42页
第四章 主旋律提取算法第42-62页
    4.1 前言第42页
    4.2 特征提取第42-44页
        4.2.1 相关图第42-43页
        4.2.2 改进的自相关图第43-44页
    4.3 基于目标基频预测IBM第44-49页
        4.3.1 独立时频单元标记第45-47页
        4.3.2 多谐波时频单元标记第47-48页
        4.3.3 相邻时频单元标记第48-49页
    4.4 基于IBM确定基频第49-51页
        4.4.1 跨通道整合第49-50页
        4.4.2 从谐波中确定周期第50页
        4.4.3 运用短时连续性估计基频第50-51页
    4.5 初始基频估计第51-55页
        4.5.1 根据听觉图估计初始基频第51-52页
        4.5.2 根据能量比估计初始基频第52-55页
    4.6 确定基频轮廓第55-57页
        4.6.1 迭代估计第55-56页
        4.6.2 确定基频曲线第56-57页
    4.7 实验结果及分析第57-61页
        4.7.1 实验数据库及评价方法第57页
        4.7.2 改进自相关实验第57-58页
        4.7.3 信噪比实验第58-59页
        4.7.4 迭代次数实验第59-60页
        4.7.5 能量特征对结果的影响第60页
        4.7.6 低通滤波实验结果第60-61页
        4.7.7 HPSS对结果的影响第61页
    4.8 小结第61-62页
第五章 总结与展望第62-64页
    5.1 总结第62页
    5.2 展望第62-64页
参考文献第64-67页
致谢第67-68页
作者攻读学位期间发表的学术论文目录第68页

论文共68页,点击 下载论文
上一篇:物联网网关的设计开发及数据异常检测研究
下一篇:个人信息网络侵权问题研究