基于内容的音频检索的关键技术研究
| 摘要 | 第1-4页 |
| Abstract | 第4-8页 |
| 第一章 绪论 | 第8-14页 |
| ·引言 | 第8-9页 |
| ·CBAR 的发展和研究现状 | 第9-10页 |
| ·本论文研究的内容和方法 | 第10-11页 |
| ·本文内容安排 | 第11-14页 |
| 第二章 音频数据分析 | 第14-26页 |
| ·主流音频文件格式介绍 | 第15-17页 |
| ·声音文件 | 第15-16页 |
| ·MIDI | 第16-17页 |
| ·模块文件 | 第17页 |
| ·音频处理技术与特征提取 | 第17-24页 |
| ·时域特征 | 第18-20页 |
| ·频域特征 | 第20-21页 |
| ·时频特征 | 第21-24页 |
| ·本章小结 | 第24-26页 |
| 第三章 音频分割与识别分类 | 第26-50页 |
| ·基于特征阈值的音频分割与分类算法 | 第26-33页 |
| ·音频分层分割与分类算法 | 第26-27页 |
| ·双模式的分割与分类算法 | 第27-33页 |
| ·基于模型的音频分割与分类 | 第33-43页 |
| ·基于HMM 的说话者分割与分类 | 第33-35页 |
| ·基于高斯模型的音频分割算法 | 第35-40页 |
| ·音频分割算法改进及实验结果 | 第40-43页 |
| ·一种基于特征阈值和模型的组合分类方法 | 第43-49页 |
| ·基于特征阈值的初始分类 | 第43-44页 |
| ·采用SVM 对语音进一步分类 | 第44-48页 |
| ·实验结果与分析 | 第48-49页 |
| ·本章小结 | 第49-50页 |
| 第四章 基于内容的音频检索技术研究 | 第50-62页 |
| ·音频特征的相似度模型 | 第51-53页 |
| ·闵氏距离 | 第51-52页 |
| ·马氏距离 | 第52页 |
| ·余弦距离 | 第52页 |
| ·非几何的相似度方法 | 第52-53页 |
| ·哼唱音乐检索 | 第53-54页 |
| ·音调跟踪 | 第53-54页 |
| ·检索引擎 | 第54页 |
| ·示例音频检索 | 第54-61页 |
| ·基于分类模型的检索算法 | 第55页 |
| ·基于音频模板的算法实现 | 第55-61页 |
| ·本章小结 | 第61-62页 |
| 第五章 CBAR 系统设计与实验分析 | 第62-67页 |
| ·系统设计概要 | 第62页 |
| ·CBAR 系统模块与库结构 | 第62-64页 |
| ·系统开发平台和界面 | 第64-65页 |
| ·实验结果分析 | 第65-66页 |
| ·本章小结 | 第66-67页 |
| 第六章 总结与展望 | 第67-69页 |
| 致谢 | 第69-70页 |
| 参考文献 | 第70-74页 |
| 在读期间发表论文 | 第74-75页 |