摘要 | 第5-7页 |
Abstract | 第7-8页 |
主要缩写对照表 | 第14-16页 |
第一章 绪论 | 第16-25页 |
1.1 音频检索的研究意义 | 第16-18页 |
1.2 音频检索的研究现状 | 第18-23页 |
1.2.1 音频特征提取和音效分类的发展现状 | 第18-21页 |
1.2.2 多媒体检索发展现状 | 第21-23页 |
1.3 论文的主要工作及章节安排 | 第23-25页 |
第二章 基于谐波分量的音频特征 | 第25-46页 |
2.1 音频的频域特征 | 第25-28页 |
2.2 谐波字典 | 第28-32页 |
2.2.1 人脑对谐波信号的感知 | 第28-30页 |
2.2.2 谐波字典 | 第30-32页 |
2.3 基于匹配追踪的频谱分解 | 第32-39页 |
2.3.1 稀疏表示的基本概念 | 第32-33页 |
2.3.2 稀疏表示的求解算法 | 第33-36页 |
2.3.3 频谱分解 | 第36-38页 |
2.3.4 音频特征的表示 | 第38-39页 |
2.4 实验与结果分析 | 第39-45页 |
2.4.1 数据库和实验平台 | 第39-41页 |
2.4.2 实验及结果分析 | 第41-45页 |
2.5 本章小结 | 第45-46页 |
第三章 基于感知子空间的时-频特征提取 | 第46-65页 |
3.1 基于心理声学的感知子空间划分 | 第46-50页 |
3.1.1 人脑对瞬变信号的感知 | 第46-49页 |
3.1.2 基于感知子空间的分解模型 | 第49-50页 |
3.2 感知子空间的数学描述 | 第50-54页 |
3.2.1 谐波子空间的数学定义 | 第50-52页 |
3.2.2 瞬时子空间的数学定义 | 第52-53页 |
3.2.3 残差子空间的数学定义 | 第53-54页 |
3.3 音频信号的分解 | 第54-57页 |
3.3.1 基于匹配追踪的音频信号分解 | 第54-56页 |
3.3.2 音频特征的表示 | 第56-57页 |
3.4 实验与结果分析 | 第57-64页 |
3.4.1 实验设置 | 第57-58页 |
3.4.2 子空间分解实例 | 第58-59页 |
3.4.3 子空间分类效果 | 第59-61页 |
3.4.4 与其他特征比较结果 | 第61-64页 |
3.5 本章小结 | 第64-65页 |
第四章 基于系数张量的时-频特征提取 | 第65-100页 |
4.1 张量的概念及其基本运算 | 第65-71页 |
4.1.1 张量的定义 | 第65-67页 |
4.1.2 张量的展开 | 第67-68页 |
4.1.3 张量的运算 | 第68-71页 |
4.1.4 张量的秩 | 第71页 |
4.2 张量分解模型 | 第71-82页 |
4.2.1 非负稀疏矩阵分解 | 第71-76页 |
4.2.2 PARAFAC模型 | 第76-79页 |
4.2.3 Tucker模型 | 第79-82页 |
4.3 基于系数张量的音频特征提取 | 第82-88页 |
4.3.1 系数张量 | 第83-85页 |
4.3.2 非负稀疏张量分解 | 第85-88页 |
4.4 计算复杂度分析 | 第88-89页 |
4.5 实验与结果分析 | 第89-98页 |
4.5.1 系数张量实例 | 第89-91页 |
4.5.2 张量分解 | 第91-93页 |
4.5.3 闭集测试结果 | 第93-97页 |
4.5.4 开集测试结果 | 第97-98页 |
4.6 本章小结 | 第98-100页 |
第五章 基于倒排索引的音频检索 | 第100-127页 |
5.1 基于不相邻数据窗的说话人分割 | 第100-106页 |
5.1.1 说话人改变检测 | 第100-102页 |
5.1.2 相邻数据窗的方法对噪音的敏感性 | 第102-103页 |
5.1.3 不相邻数据窗 | 第103-106页 |
5.2 基于多层结构的音频分割算法 | 第106-109页 |
5.2.1 基于能量的分割 | 第107页 |
5.2.2 基于内容的分割 | 第107-108页 |
5.2.3 基于一阶、二阶统计量的分割 | 第108-109页 |
5.3 基于倒排索引的音频内容检索 | 第109-118页 |
5.3.1 检索算法 | 第109-110页 |
5.3.2 半监督的音频字典和音频字量化 | 第110-113页 |
5.3.3 倒排索引的建立 | 第113-116页 |
5.3.4 基于倒排索引的检索 | 第116-118页 |
5.4 实验与结果分析 | 第118-126页 |
5.4.1 基于不相邻窗的说话人改变检测 | 第118-120页 |
5.4.2 内容检索数据库及实验设置 | 第120-122页 |
5.4.3 查询样本时长和返回结果个数对查询结果的影响 | 第122页 |
5.4.4 与其他检索算法的比较结果 | 第122-126页 |
5.5 本章小结 | 第126-127页 |
第六章 总结与展望 | 第127-130页 |
研究总结 | 第127-128页 |
后续工作展望 | 第128-130页 |
参考文献 | 第130-140页 |
攻读博士学位期间取得的研究成果 | 第140-142页 |
致谢 | 第142-144页 |
附件 | 第144页 |