摘要 | 第5-7页 |
ABSTRACT | 第7-9页 |
目录 | 第10-14页 |
第一章 绪论 | 第14-28页 |
1.1 研究意义 | 第14-17页 |
1.2 研究现状 | 第17-20页 |
1.3 本文的研究内容和成果 | 第20-23页 |
1.4 论文的组织结构 | 第23-24页 |
参考文献 | 第24-28页 |
第二章 音乐及其信号特征 | 第28-36页 |
2.1 音乐乐理基础 | 第28-31页 |
2.1.1 音乐的产生 | 第28页 |
2.1.2 音乐的基本要素 | 第28-31页 |
2.2 音乐信号的物理特征 | 第31-34页 |
2.2.1 时域特征 | 第31-32页 |
2.2.2 频域特征 | 第32-33页 |
2.2.3 倒谱特征 | 第33-34页 |
2.3 本章小结 | 第34页 |
参考文献 | 第34-36页 |
第三章 基于哼唱的音乐检索 | 第36-58页 |
3.1 概述 | 第36-38页 |
3.2 特征提取 | 第38-47页 |
3.2.1 MIDI音乐库主旋律提取 | 第38-40页 |
3.2.2 哼唱片段基频提取 | 第40-43页 |
3.2.3 特征后处理 | 第43-47页 |
3.3 检索匹配算法 | 第47-55页 |
3.3.1 线性伸缩 | 第47-48页 |
3.3.2 动态时间规整 | 第48-50页 |
3.3.3 迭代对齐 | 第50-51页 |
3.3.4 局域敏感哈希 | 第51-53页 |
3.3.5 推土机距离 | 第53-54页 |
3.3.6 字符串对齐 | 第54-55页 |
3.4 本章小结 | 第55页 |
参考文献 | 第55-58页 |
第四章 哼唱检索匹配算法 | 第58-76页 |
4.1 基于音符的LSH检索 | 第59-63页 |
4.1.1 基于音符的LSH算法 | 第59-61页 |
4.1.2 基于音符和基频相结合的LSH算法 | 第61页 |
4.1.3 NLSH实验 | 第61-62页 |
4.1.4 NPLSH实验 | 第62-63页 |
4.2 边界对齐线性伸缩 | 第63-65页 |
4.2.1 边界对齐线性伸缩算法 | 第63-64页 |
4.2.2 BALS实验 | 第64-65页 |
4.3 重音移位迭代对齐 | 第65-68页 |
4.3.1 重音移位迭代对齐算法 | 第65-67页 |
4.3.2 KTRA实验 | 第67-68页 |
4.4 哼唱速率融合 | 第68-69页 |
4.4.1 伸缩因子与KTRA融合算法 | 第68-69页 |
4.4.2 SF与KTRA融合算法实验 | 第69页 |
4.5 局部对齐 | 第69-74页 |
4.5.1 局部对齐线性伸缩算法 | 第71页 |
4.5.2 局部对齐动态时间规整算法 | 第71-72页 |
4.5.3 LALS实验 | 第72-73页 |
4.5.4 LADTW实验 | 第73页 |
4.5.5 不同检索算法实验 | 第73-74页 |
4.6 本章小结 | 第74页 |
参考文献 | 第74-76页 |
第五章 基于局域敏感哈希的海量数据检索 | 第76-102页 |
5.1 局域敏感哈希算法 | 第76-82页 |
5.1.1 相似性搜索 | 第76-80页 |
5.1.2 局域敏感哈希算法的发展 | 第80-82页 |
5.2 基于P稳态分布的局域敏感哈希算法 | 第82-86页 |
5.2.1 通用的LSH框架 | 第82-85页 |
5.2.2 基于P稳态分布的LSH算法 | 第85-86页 |
5.3 基于熵的局域敏感哈希算法 | 第86-91页 |
5.3.1 哈希映射 | 第87页 |
5.3.2 基于熵的LSH算法 | 第87-88页 |
5.3.3 参数优化 | 第88-89页 |
5.3.4 实验结果 | 第89-91页 |
5.4 边界扩展局域敏感哈希算法 | 第91-97页 |
5.4.1 边界扩展LSH算法 | 第91-93页 |
5.4.2 参数优化 | 第93-94页 |
5.4.3 实验结果 | 第94-97页 |
5.5 本章小结 | 第97页 |
参考文献 | 第97-102页 |
第六章 面向海量音乐数据的哼唱检索匹配算法 | 第102-122页 |
6.1 基于音符和基频的两层LSH检索算法 | 第102-111页 |
6.1.1 基于音符的LSH索引 | 第104-105页 |
6.1.2 基于熵的LSH | 第105-106页 |
6.1.3 两层LSH滤波检索 | 第106-107页 |
6.1.4 精确匹配算法 | 第107-108页 |
6.1.5 实验结果 | 第108-111页 |
6.2 基于哼唱速率的多层滤波检索算法 | 第111-116页 |
6.2.1 基于哼唱速率的三层滤波检索 | 第112页 |
6.2.2 检索流程 | 第112-114页 |
6.2.3 实验结果 | 第114-116页 |
6.3 基于哼唱速率融合的渐进式滤波算法 | 第116-118页 |
6.3.1 基于哼唱速率与KTRA融合的渐进式滤波算法 | 第116-117页 |
6.3.2 实验结果 | 第117-118页 |
6.4 演示系统 | 第118-119页 |
6.5 本章小结 | 第119页 |
参考文献 | 第119-122页 |
第七章 基于样例的音乐检索 | 第122-150页 |
7.1 概述 | 第122-124页 |
7.2 Shazam检索算法 | 第124-129页 |
7.2.1 音乐指纹提取 | 第124-126页 |
7.2.2 检索匹配算法 | 第126-129页 |
7.3 PRH检索算法 | 第129-133页 |
7.3.1 音乐指纹提取 | 第130-131页 |
7.3.2 检索匹配算法 | 第131-133页 |
7.4 基于结构音乐指纹的两层滤波检索算法 | 第133-141页 |
7.4.1 音乐指纹提取 | 第133-136页 |
7.4.2 两阶段检索匹配算法 | 第136-139页 |
7.4.3 两层滤波检索算法 | 第139-141页 |
7.5 实验设定和结果 | 第141-146页 |
7.5.1 实验数据 | 第141-142页 |
7.5.2 不同时间间隔实验 | 第142-143页 |
7.5.3 边界效应实验 | 第143页 |
7.5.4 不同帧移选择实验 | 第143-144页 |
7.5.5 两层滤波检索实验 | 第144-145页 |
7.5.6 不同检索算法对比实验 | 第145-146页 |
7.6 演示系统 | 第146-147页 |
7.7 本章小结 | 第147-148页 |
参考文献 | 第148-150页 |
第八章 总结与展望 | 第150-154页 |
8.1 论文总结 | 第150-151页 |
8.2 研究展望 | 第151-154页 |
博士期间发表的论文 | 第154-156页 |
博士期间申请的发明专利 | 第156-158页 |
致谢 | 第158页 |