压缩域鲁棒音乐识别算法研究

摘要	第1-4页
Abstract	第4-7页
第一章概述	第7-10页
·多媒体信息检索	第7页
·基于内容的音频信息检索	第7-8页
·本文主要贡献和结构	第8-10页
第二章基于内容的音频信息检索综述	第10-23页
·基本音频知识	第10页
·音频信息检索的背景	第10-11页
·音频信息检索的分类和音频指纹	第11-13页
·使用音频指纹的好处	第13页
·音频指纹使用模型及其典型应用	第13-15页
·音频识别	第13-14页
·内容完整性校验	第14-15页
·辅助水印技术	第15页
·基于内容的音频检索和处理	第15页
·音频指纹的性能要求	第15-16页
·音频指纹框架	第16-20页
·前端处理	第17-20页
·前处理	第17-18页
·分帧和重叠	第18-19页
·空间转换	第19页
·特征提取	第19-20页
·后处理	第20页
·指纹的模型化	第20页
·指纹的匹配算法	第20页
·检索效果的评价	第20-21页
·本文研究方向及其特点	第21-23页
第三章基本知识和压缩域音频研究现状	第23-32页
·常见的音频数据格式	第23-24页
·PCM编码	第23页
·WAV格式	第23-24页
·MIDI格式	第24页
·MP3	第24页
·压缩域音频指纹研究现状	第24-25页
·MP3编解码器基本原理	第25-32页
第四章:基于Zernike矩的音频指纹	第32-41页
引言	第32页
·Zernike-moment多项式和矩	第32-34页
·指纹构造方法	第34-37页
·对齐频率分辨率	第34-35页
·构造MDCT系数"图片"	第35-36页
·计算"伪图片"的矩	第36-37页
·指纹建模	第37页
·指纹间的匹配	第37-38页
·实验结果	第38-41页
·BER阈值的确定	第39页
·检索结果和结果讨论	第39-41页
第五章基于熵的音频指纹	第41-53页
算法思想	第41页
·熵的基本原理	第41-42页
·压缩域MDCT频谱熵	第42-43页
·算法详述	第43-48页
·节(granule)聚块(block)	第43-44页
·子带划分	第44-45页
·计算MDCT频谱熵	第45-46页
·指纹模型	第46-47页
·识别算法	第47-48页
·实验结果	第48-52页
·BER阈值的设定	第48-50页
·识别结果	第50-52页
·结论	第52-53页
总结和展望	第53-54页
参考文献	第54-59页
攻读硕士期间发表的论文	第59-60页
致谢	第60-61页