基于听觉场景分析的主旋律提取

摘要	第4-6页
ABSTRACT	第6-8页
第一章绪论	第11-15页
1.1 研究背景与意义	第11-12页
1.2 研究现状及问题	第12-14页
1.3 论文结构	第14-15页
第二章计算听觉场景分析	第15-29页
2.1 简介	第15-16页
2.2 听觉外围	第16-18页
2.2.1 中耳外耳预放大	第16页
2.2.2 耳蜗滤波和滤波器	第16-17页
2.2.3 内耳毛细胞Meddis模型	第17-18页
2.3 听觉图表示	第18-23页
2.3.1 自相关	第18-19页
2.3.2 互相关	第19-20页
2.3.3 频谱转移图	第20-23页
2.3.4 起始/截止图	第23页
2.4 音源分离	第23-28页
2.4.1 听觉元素	第23-24页
2.4.2 基于基频分组	第24-27页
2.4.3 基于共同的onset和offset分组	第27页
2.4.4 听觉场景搜索	第27-28页
2.4.5 音源再合成	第28页
2.5 小结	第28-29页
第三章信号预处理	第29-42页
3.1 弦乐/打击乐器声音分离	第29-34页
3.1.1 基于信息散度混合模型	第31-33页
3.1.2 基于强假设混合模型	第33-34页
3.2 低通滤波	第34-35页
3.3 实验结果	第35-40页
3.3.1 HPSS实验结果	第35-38页
3.3.2 低通滤波实验结果	第38-40页
3.4 小结	第40-42页
第四章主旋律提取算法	第42-62页
4.1 前言	第42页
4.2 特征提取	第42-44页
4.2.1 相关图	第42-43页
4.2.2 改进的自相关图	第43-44页
4.3 基于目标基频预测IBM	第44-49页
4.3.1 独立时频单元标记	第45-47页
4.3.2 多谐波时频单元标记	第47-48页
4.3.3 相邻时频单元标记	第48-49页
4.4 基于IBM确定基频	第49-51页
4.4.1 跨通道整合	第49-50页
4.4.2 从谐波中确定周期	第50页
4.4.3 运用短时连续性估计基频	第50-51页
4.5 初始基频估计	第51-55页
4.5.1 根据听觉图估计初始基频	第51-52页
4.5.2 根据能量比估计初始基频	第52-55页
4.6 确定基频轮廓	第55-57页
4.6.1 迭代估计	第55-56页
4.6.2 确定基频曲线	第56-57页
4.7 实验结果及分析	第57-61页
4.7.1 实验数据库及评价方法	第57页
4.7.2 改进自相关实验	第57-58页
4.7.3 信噪比实验	第58-59页
4.7.4 迭代次数实验	第59-60页
4.7.5 能量特征对结果的影响	第60页
4.7.6 低通滤波实验结果	第60-61页
4.7.7 HPSS对结果的影响	第61页
4.8 小结	第61-62页
第五章总结与展望	第62-64页
5.1 总结	第62页
5.2 展望	第62-64页
参考文献	第64-67页
致谢	第67-68页
作者攻读学位期间发表的学术论文目录	第68页