基于内容的音频检索的关键技术研究
摘要 | 第1-4页 |
Abstract | 第4-8页 |
第一章 绪论 | 第8-14页 |
·引言 | 第8-9页 |
·CBAR 的发展和研究现状 | 第9-10页 |
·本论文研究的内容和方法 | 第10-11页 |
·本文内容安排 | 第11-14页 |
第二章 音频数据分析 | 第14-26页 |
·主流音频文件格式介绍 | 第15-17页 |
·声音文件 | 第15-16页 |
·MIDI | 第16-17页 |
·模块文件 | 第17页 |
·音频处理技术与特征提取 | 第17-24页 |
·时域特征 | 第18-20页 |
·频域特征 | 第20-21页 |
·时频特征 | 第21-24页 |
·本章小结 | 第24-26页 |
第三章 音频分割与识别分类 | 第26-50页 |
·基于特征阈值的音频分割与分类算法 | 第26-33页 |
·音频分层分割与分类算法 | 第26-27页 |
·双模式的分割与分类算法 | 第27-33页 |
·基于模型的音频分割与分类 | 第33-43页 |
·基于HMM 的说话者分割与分类 | 第33-35页 |
·基于高斯模型的音频分割算法 | 第35-40页 |
·音频分割算法改进及实验结果 | 第40-43页 |
·一种基于特征阈值和模型的组合分类方法 | 第43-49页 |
·基于特征阈值的初始分类 | 第43-44页 |
·采用SVM 对语音进一步分类 | 第44-48页 |
·实验结果与分析 | 第48-49页 |
·本章小结 | 第49-50页 |
第四章 基于内容的音频检索技术研究 | 第50-62页 |
·音频特征的相似度模型 | 第51-53页 |
·闵氏距离 | 第51-52页 |
·马氏距离 | 第52页 |
·余弦距离 | 第52页 |
·非几何的相似度方法 | 第52-53页 |
·哼唱音乐检索 | 第53-54页 |
·音调跟踪 | 第53-54页 |
·检索引擎 | 第54页 |
·示例音频检索 | 第54-61页 |
·基于分类模型的检索算法 | 第55页 |
·基于音频模板的算法实现 | 第55-61页 |
·本章小结 | 第61-62页 |
第五章 CBAR 系统设计与实验分析 | 第62-67页 |
·系统设计概要 | 第62页 |
·CBAR 系统模块与库结构 | 第62-64页 |
·系统开发平台和界面 | 第64-65页 |
·实验结果分析 | 第65-66页 |
·本章小结 | 第66-67页 |
第六章 总结与展望 | 第67-69页 |
致谢 | 第69-70页 |
参考文献 | 第70-74页 |
在读期间发表论文 | 第74-75页 |