首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

压缩域鲁棒音乐识别算法研究

摘要第1-4页
Abstract第4-7页
第一章 概述第7-10页
   ·多媒体信息检索第7页
   ·基于内容的音频信息检索第7-8页
   ·本文主要贡献和结构第8-10页
第二章 基于内容的音频信息检索综述第10-23页
   ·基本音频知识第10页
   ·音频信息检索的背景第10-11页
   ·音频信息检索的分类和音频指纹第11-13页
   ·使用音频指纹的好处第13页
   ·音频指纹使用模型及其典型应用第13-15页
     ·音频识别第13-14页
     ·内容完整性校验第14-15页
     ·辅助水印技术第15页
     ·基于内容的音频检索和处理第15页
   ·音频指纹的性能要求第15-16页
   ·音频指纹框架第16-20页
     ·前端处理第17-20页
       ·前处理第17-18页
       ·分帧和重叠第18-19页
       ·空间转换第19页
       ·特征提取第19-20页
       ·后处理第20页
       ·指纹的模型化第20页
   ·指纹的匹配算法第20页
   ·检索效果的评价第20-21页
   ·本文研究方向及其特点第21-23页
第三章 基本知识和压缩域音频研究现状第23-32页
   ·常见的音频数据格式第23-24页
     ·PCM编码第23页
     ·WAV格式第23-24页
     ·MIDI格式第24页
     ·MP3第24页
   ·压缩域音频指纹研究现状第24-25页
   ·MP3编解码器基本原理第25-32页
第四章:基于Zernike矩的音频指纹第32-41页
 引言第32页
   ·Zernike-moment多项式和矩第32-34页
   ·指纹构造方法第34-37页
     ·对齐频率分辨率第34-35页
     ·构造MDCT系数"图片"第35-36页
     ·计算"伪图片"的矩第36-37页
     ·指纹建模第37页
   ·指纹间的匹配第37-38页
   ·实验结果第38-41页
     ·BER阈值的确定第39页
     ·检索结果和结果讨论第39-41页
第五章 基于熵的音频指纹第41-53页
 算法思想第41页
   ·熵的基本原理第41-42页
   ·压缩域MDCT频谱熵第42-43页
   ·算法详述第43-48页
     ·节(granule)聚块(block)第43-44页
     ·子带划分第44-45页
     ·计算MDCT频谱熵第45-46页
     ·指纹模型第46-47页
     ·识别算法第47-48页
   ·实验结果第48-52页
     ·BER阈值的设定第48-50页
     ·识别结果第50-52页
   ·结论第52-53页
总结和展望第53-54页
参考文献第54-59页
攻读硕士期间发表的论文第59-60页
致谢第60-61页

论文共61页,点击 下载论文
上一篇:P2P流媒体视频系统中的内容保护
下一篇:面向气象语音呼叫中心的语音合成软件设计与实现