中英对照表 | 第8-9页 |
摘要 | 第9-10页 |
Abstract | 第10-11页 |
第1章 绪论 | 第12-16页 |
1.1 研究的背景和意义 | 第12-13页 |
1.2 研究的内容和主要贡献 | 第13-15页 |
1.3 论文结构 | 第15-16页 |
第2章 音乐信息检索中的时频分析方法综述 | 第16-28页 |
2.1 常用的音乐时频表示 | 第16-21页 |
2.1.1 短时傅里叶变换时频谱图 | 第16-18页 |
2.1.2 常数Q变换时频谱图 | 第18-19页 |
2.1.3 Chromagram | 第19页 |
2.1.4 基于伽马通滤波器组的时频表示 | 第19-21页 |
2.2 基于时频表示的音乐分析方法 | 第21-28页 |
2.2.1 基于正弦建模的方法 | 第21页 |
2.2.2 基于相似矩阵的方法 | 第21-24页 |
2.2.3 基于计算机视觉的方法 | 第24-25页 |
2.2.4 基于矩阵分解的方法 | 第25-28页 |
第3章 基于时频谱图SIFT特征的鲁棒音乐识别 | 第28-46页 |
3.1 简介及相关工作 | 第28-32页 |
3.2 鲁棒音频指纹提取 | 第32-37页 |
3.2.1 时频谱图图像构建 | 第32-33页 |
3.2.2 音频的时频处理和CQT时频谱图图像变换之间的关系 | 第33-35页 |
3.2.3 时频谱图图像特征提取 | 第35-37页 |
3.3 音频指纹的匹配 | 第37-39页 |
3.3.1 基于局部敏感哈希的最近邻子指纹检索 | 第37-38页 |
3.3.2 子指纹的匹配确定 | 第38-39页 |
3.4 算法评测 | 第39-44页 |
3.4.1 数据库 | 第39-40页 |
3.4.2 参数设置 | 第40-42页 |
3.4.3 鲁棒性测试 | 第42-44页 |
3.5 本章总结 | 第44-46页 |
第4章 基于多层时频谱图分解的单声道歌声分离 | 第46-74页 |
4.1 简介及相关工作 | 第46-48页 |
4.2 算法描述 | 第48-53页 |
4.2.1 基于长窗口时频谱图分解的谐和乐器消减 | 第48-51页 |
4.2.2 基于短窗口时频谱图分解的打击乐器消减 | 第51-53页 |
4.2.3 歌声分离的两种策略 | 第53页 |
4.3 基于MIR-1K数据集的算法评测 | 第53-66页 |
4.3.1 数据集 | 第54-55页 |
4.3.2 评测指标 | 第55页 |
4.3.3 参数设置 | 第55-58页 |
4.3.4 不同分离策略的性能 | 第58-62页 |
4.3.5 算法比较 | 第62-66页 |
4.4 基于Beach-Boys数据集的算法评测 | 第66-72页 |
4.4.1 数据集 | 第66页 |
4.4.2 参数设置 | 第66-67页 |
4.4.3 算法比较1 | 第67-70页 |
4.4.4 算法比较2 | 第70-72页 |
4.5 本章总结 | 第72-74页 |
第5章 使用非负矩阵分解改进基于音高推断的单声道歌声分离 | 第74-84页 |
5.1 简介 | 第74页 |
5.2 算法描述 | 第74-78页 |
5.2.1 歌声定位 | 第75页 |
5.2.2 歌声音高提取 | 第75页 |
5.2.3 歌声分离 | 第75-78页 |
5.3 算法评测 | 第78-82页 |
5.3.1 对歌声定位的评测 | 第78-80页 |
5.3.2 对歌声音高提取的评测 | 第80页 |
5.3.3 对歌声分离的评测 | 第80-82页 |
5.4 本章总结 | 第82-84页 |
第6章 总结与展望 | 第84-86页 |
参考文献 | 第86-100页 |
发表文章目录 | 第100-102页 |
致谢 | 第102-103页 |